– Type: Khai báo kiểu dữ liệu. Có nhiều tùy chọn kiểu dữ liệu, tuy nhiên, tác giả sẽ chỉ trình bày 2 kiểu dữ liệu thường dùng nhất khi làm luận văn là Numeric và String. Nếu giá trị nhập vào là một con số, chúng ta sẽ khai báo là Numeric; nếu giá trị nhập vào là ký tự văn bản, chúng ta khai báo là String. Ví dụ: Chúng ta có biến Giới tính, trường hợp không mã hóa Nam thành 1, Nữ thành 2 mà muốn nhập dạng văn bản “Nam” – “Nữ” vào SPSS thì chúng ta sẽ phải khai báo kiểu dữ liệu là String; trường hợp nhập vào con số đã mã hóa 1 – 2 đại diện cho Nam – Nữ thì chúng ta sẽ khai báo kiểu dữ liệu là Numeric.
– Width: Số lượng ký tự tối đa. Nếu chúng ta nhập vào giá trị có số ký tự lớn hơn 8, chúng ta cần tăng giá trị Width lên phù hợp. Cũng không nên tăng quá cao như 500, 1000 vì chúng ta gần như không bao giờ nhập vào một ô giá trị có số ký tự cao như vậy. Việc để thừa số ký tự trống quá nhiều sẽ làm tệp dữ liệu nặng hơn một cách không cần thiết.

Khi nhập liệu, nếu ô giá trị không hiển thị đầy đủ các ký tự chúng ta nhập vào mà bị cắt mất một đoạn phía sau, nghĩa là Width của ô đó quá nhỏ, không đủ chứa số ký tự chúng ta đã nhập vào. Như ví dụ bên dưới, biến NgheNghiep1 có giá trị Width rất nhỏ nên không thể chứa đủ chuỗi văn bản nhập vào, do đó nghề nghiệp được nhập trong cột biến NgheNghiep1 không được hiển thị đầy đủ.

– Decimals: Số ký tự thập phân. Nếu dữ liệu thu thập là các con số nguyên, chúng ta nên để là 0. Nếu dữ liệu có phần thập phân, chúng ta sẽ tùy chỉnh Decimals tăng lên 1, 2, 3… tùy vào số ký tự thập phân muốn thể hiện.
– Label: Khai báo nhãn cho biến. Đây là phần chúng ta giải thích ý nghĩa cho cột tên biến Name. Trong Label chúng ta không bị giới hạn bởi các quy tắc đặt tên, có thể viết dài, viết ngắn, viết có dấu Tiếng Việt và tự do sử dụng dấu cách trắng.
– Values: Khai báo giá trị của biến. Mỗi giá trị sẽ tương ứng với một trường hợp xảy ra của biến và được xác định bằng một con số (value) đi kèm với một nhãn giải thích (label). Ví dụ, biến Bộ phận làm việc có các giá trị là Phòng nhân sự, Phòng kế toán, Phòng sản xuất, Phòng marketing. Tác giả sẽ khai báo value = 1 tương ứng label “Phòng Nhân sự”, tương tự cho các giá trị 2, 3, 4.
– Missing: Khai báo các giá trị khuyết trong dữ liệu. Một số trường hợp dữ liệu chúng ta xuất hiện các giá trị khuyết, nghĩa là tại ô dữ liệu đó không có giá trị nào được nhập. Lý do xuất hiện giá trị khuyết đến từ nhiều nguyên nhân: bản chất câu hỏi khảo sát, đáp viên không trả lời, do sơ sót từ người nhập liệu… Chúng ta sẽ cần khai báo giá trị khuyết để phần mềm hiểu được giá trị khuyết có tồn tại và giá trị khuyết đó đến từ nguyên nhân nào. Điều này rất quan trọng, bởi một số kiểm định, phần mềm sẽ dựa vào khai báo missing value để quyết định có đưa quan sát đó vào tính toán không.
Ở hàng Discrete missing values có ba ô, tương ứng phần mềm cho phép bạn khai báo ba loại giá trị khuyết. Giả sử trong cùng một biến của dữ liệu có hai loại giá trị khuyết. Loại thứ nhất là do câu hỏi, người nào phù hợp mới trả lời câu hỏi đó, người nào không phù hợp sẽ không trả lời, điều này dẫn đến các ô dữ liệu của người không phù hợp sẽ là các ô khuyết. Thay vì để trống ô, chúng ta nhập vào các ô đó giá trị 99, đồng thời khai báo missing value của biến đó ở ô số một là 99. Loại giá trị khuyết thứ hai là do một số đáp viên bỏ sót câu hỏi. Chúng ta cũng khai báo cho phần mềm biết đó là missing value, để tránh trùng với giá trị 99 – nguyên nhân do bản chất câu hỏi, chúng ta khai báo là 88 cho loại giá trị khuyết thứ hai, nhập vào ô thứ hai ở Discrete missing values là 88.

– Measure: Chọn loại thang đo thể hiện dữ liệu: Thang đo định danh (Nominal), Thang đo thứ bậc (Ordinal), Thang đo mức độ (Scale).
2. Nhập liệu trong SPSS
Sau khi khai báo biến vào SPSS xong, chúng ta chuyển sang giao diện Data View để tiến hành nhập liệu. Nếu Variable View làm nhiệm vụ tạo khuôn, thì Data View làm nhiệm vụ đưa nội dung vào khuôn dữ liệu đã tạo.
Trong giao diện Data View, các cột sẽ biểu diễn danh sách biến, các hàng được đánh dấu số thứ tự 1, 2, 3,… đại diện cho từng quan sát của mẫu. Kết quả giá trị được nhập vào ở mỗi hàng đại diện cho câu trả lời của một đáp viên.

Từ kết quả khảo sát thô thu được trên các phiếu khảo sát giấy hoặc khảo sát online. Chúng ta cần xử lý chúng để có được các con số, văn bản có thể thực hiện phân tích được. Việc làm này gọi là mã hóa và nhập liệu trong SPSS.
Sẽ có nhiều dạng câu hỏi khác nhau và cách thức nhập liệu khác nhau như: câu hỏi định tính một trả lời, câu hỏi định tính nhiều trả lời, câu hỏi định lượng một trả lời, câu hỏi mở, câu hỏi xếp hạng… Chúng ta cần khai báo và nhập liệu đúng cho mỗi dạng câu hỏi thì phần xử lý dữ liệu trên SPSS về sau mới cho ra kết quả chính xác.
3. Thực hành khai báo biến và nhập liệu trong SPSS
Dưới đây là phần thực hành về cách khai báo biến và nhập liệu cho một số dạng câu hỏi tiêu biểu trong nghiên cứu marketing.
1. Khai báo biến trong SPSS cho câu định tính một trả lời
Toàn bộ các câu hỏi phần thông tin chung như giới tính, độ tuổi, học vấn,… là điển hình cho dạng câu hỏi định tính một trả lời.

Đối với câu hỏi định tính một trả lời, mỗi câu hỏi sẽ tương ứng với một biến trong khuôn dữ liệu.
- Name: Nếu có thể, nên đặt tên ngắn gọn nhưng có thể mô tả được nội dung biến. Ví dụ, thay vì đặt tên là Cau_1, chúng ta nên dùng tên biến là GioiTinh để mã hóa cho câu hỏi về giới tính.
- Type: Có thể để dạng Numeric hoặc String. Tuy nhiên, trừ một số trường hợp đặc biệt bắt buộc phải để dạng String, thông thường chúng ta nên chọn Numeric để dễ dàng dùng các biến này cho các tính toán liên quan đến con số.
- Label: Nên đặt tên Label để tăng thẩm mỹ cho các bảng kết quả xuất ra.
- Measure: Tùy dạng câu hỏi mà sẽ là Nominal hoặc Ordinal.
- Values: Gán mỗi đáp án lần lượt với một con số. Các con số nên đặt theo thứ tự tăng dần liên tục.
Khi nhập liệu, mỗi hàng tương ứng với một đáp viên. Ví dụ, người số 1 có giới tính nam (mã hóa là 1), tuổi từ 26 – 35 tuổi (mã hóa là 2), học vấn đại học (mã hóa 3), thâm niên 3 – 5 năm (mã hóa 3), thu nhập từ 15 – dưới 20 triệu (mã hóa 3). Chúng ta sẽ nhập ở hàng thứ nhất lần lượt các con số tương ứng các cột là: 1, 2, 3, 3, 3. Sau khi hoàn thành nhập liệu toàn bộ đáp án các câu hỏi còn lại của người thứ nhất, chúng ta chuyển sang hàng thứ hai và thực hiện tương tự.
