Hướng dẫn sử dụng spss để phân tích dữ liệu

Quy trình xử lý và phân tích dữ liệu cơ bản. Chi tiết như sau:  Cách mã hóa dữ liệu  Làm sạch dữ liệu, xử lý dữ liệu bị thiếu, dữ liệu bị đột biến, cách phát hiện dữ liệu bị sai sót  Thống kê mô tả: Thống kê tần suất, thống kê tần suất nâng cao, thống kê tỉ lệ.  Kiểm định độ tin cậy của thang đo  Phân tích nhân tố khám phá, các phép xoay nhân tố  Phân tích hồi quy, gồm hệ số hồi quy chưa chuẩn hóa, hệ số hồi quy chuẩn hóa, cách đọc và ý nghĩa thực tế của các hệ số hồi quy.  Kiểm định sự phù hợp của mô hình, gồm: Phân tích phương sai ANOVA, kiểm định đa cộng tuyến hoàn hảo, kiểm định tự tương quan, kiểm định phân phối chuẩn của phần dư.  Một số kiểm định nâng cao  Xuất kết quả từ phần mềm SPSS sang Microsoft Word Có thể khái quát thành các bước như sau:  Bước 1: Mã hóa các câu hỏi điều tra thành dạng con số  Bước 2: Nhập liệu vào phần mềm Excel  Bước 3: Kiểm tra, xử lý và làm sạch dữ liệu [dữ liệu bị thiếu, dữ liệu bị dị biệt]  Bước 4: Import dữ liệu từ Excel vào SPSS  Bước 5: Thiết lập lại tên biến và đặc tính của biến [Gán nhãn cho biến, thiết lập lại đặc tính của biến, định dạng cho đúng thang đo]  Bước 6: Phân tích thống kê mô tả sơ bộ o Phân tích đặc điểm chung [Giá trị trung bình, giá trị trung vị, giá trị lớn nhất, giá trị nhỏ nhất, độ lệch chuẩn, độ nhọn, độ nghiêng] o Phân tích tần số, phân tích tỉ lệ o Phân tích tần số nâng cao  Bước 7: Kiểm định độ tin cậy của các thang đo  Bước 8: Phân tích nhân tố khám phá EFA  Bước 9: Phân tích tương quan  Bước 10: Phân tích hồi quy OLS  Bước 11: Kiểm định sự phù hợp của mô hình

 Bước 12: Kiểm định sự khác biệt

Hình: Quy trình nghiên cứu khoa học tổng quát

  1. Cách mã hóa dữ liệu Chúng ta không thể áp dụng các phép toán [cộng, trừ, nhân, chia] cho các câu hỏi. Do vậy, việc đầu tiên sau khi thu thập đầy đủ bảng hỏi là phải mã hóa chúng thành các con số vào 1 phần mềm phân tích. Mã hóa thực chất là những quy ước mà người nghiên cứu tự đặt ra một cách thống nhất và xuyên suốt trong toàn bộ nghiên cứu của mình.  Ví dụ: Với câu hỏi nhân khẩu học về giới tính [nam, nữ] thì chúng ta không thể phân tích bằng cách lấy chữ “nam giới” nhân với 1 biến khác. Nhưng chúng ta hoàn toàn có thể thực hiện được nếu người nghiên cứu đưa ra quy ước mã hóa: Nam giới = 1, và nữ giới = 2.
  2. Kiểm tra và phát hiện các sai sót do nhập liệu Sai sót có thể xảy ra trong quá trình nhập liệu [chủ quan hoặc khách quan], nên trước khi phân tích người nghiên cứu phải kiểm tra lại toàn bộ dữ liệu, tránh để các sai sót tồn tại có thể ảnh hưởng đến kết quả cuối cùng hoặc không thể phân tích được. Cách làm  Bước 1: Trên file Excel ở mục 2, chúng ta chọn Data  Filter [hoặc ấn phím tắt là Ctrl + Shift + L].  Bước 2: Trên dòng 1, cạnh tên các biến sẽ xuất hiện ô tam giác nhỏ.  Bước 3: Click chuột trái vào ô tam giác đó để hiện ra các thông tin chi tiết trong toàn bộ cột đó. Nếu các thông tin này có những “dị biệt” khác với các quy ước mã hóa ở mục 1 thì đây là những sai sót cần hiệu chỉnh.  Bước 4: Tra lại bảng hỏi gốc để hiệu chỉnh sai sót. Làm lần lượt từ cột 2 cho tới cột cuối cùng.  Bước 5: Đặt tên sheet chứa dữ liệu. Lưu  lại file Excel đã được xử lý hết sai sót. Nhớ đường dẫn đến file đó để thực hiện tiếp các bước sau. Hình bên cạnh minh họa cho trong cột work1 bị xuất hiện những dòng không có dữ liêu [Blanks]  Đây được coi là sai sót cần phải hiệu chỉnh.
  3. Nhập dữ liệu từ Excel vào phần mềm SPSS  Bước 1: Mở phần mềm SPSS, chọn File  Import Data  Excel.  Bước 2: Hộp Open Data xuất hiện, trong mục Look In, chọn đường dẫn đến nơi lưu file Excel đã qua xử lý ở mục 3  Open.

 Bước 3: Trong hộp Read Excel File, bạn lưu ý mục Worksheet là nơi khai báo sheet chứa dữ liệu trên file Excel [lưu ý, nếu mục 2 mà bạn chỉ để 1 sheet duy nhất thì SPSS sẽ nhận diện đúng sheet chứa dữ liệu luôn]. o Bạn bắt buộc phải tick vào ô “Read variable names from first row of data”. Hàm ý bạn chỉ cho SPSS biết dòng đầu tiên là dòng ghi tên biến. o Các mục chọn khác, bạn có thể chọn tham khảo như hình minh họa rồi

nhấn OK. 5. Thiết lập lại tên biến và đặc tính của biến Ở mục 1 và mục 2 chúng ta đã mã hóa câu hỏi, do vậy đến mục 5 chúng ta nên giải mã câu hỏi [mặc dù việc này không phải là yêu cầu bắt buộc] để khi đọc các kết quả phân tích xuất ra từ phần mềm SPSS sẽ thuận lợi hơn. Cách làm  Bước 1: Trong thẻ Data View, bạn nên dành thời gian để kiểm tra nhanh việc import dữ liệu từ Excel có bị mất dữ liệu không? [Xem số id cuối cùng trên file SPSS và cột Missing].  Bước 2: Bạn chuyển sang thẻ Variable View [thẻ thiết lập các thuộc tính cho biến] o Cột Name: là tên biến/tên câu hỏi [cột này để mặc định, ko chỉnh sửa] o Cột Type: là quy định dạng dữ liệu [dạng số: Numetric; dạng chữ: String; dạng ngày tháng: Data; dạng tiền tệ: Dollar ..] [lưu ý: những câu hỏi nào phải thực hiện các phép toán thì quy định dạng: Numetric]. o Cột Width: là số kí tự trước dấy phảy [để mặc định]

 Xem lại các dạng thang đo ở Chương 7.

 Bước 3: Lưu file để phục vụ cho phân tích. Chọn File  Save/Save As. Hộp Save Data As xuất hiện. o Mục Look in: là đường dẫn đến nơi lưu file o Mục File name: Đặt tên file [nên đặt tiếng Việt nhưng không có dấu] o Mục Save as type: Để mặc định là dạng *.sav [định dạng file SPSS] o Khai báo xong  Chọn Save để lưu lại. Rồi tắt hẳn phần mềm SPSS. 6. Phân tích thống kê mô tả 6. Phân tích tỉ lệ và phần trăm Phân tích thống kê mô tả nhằm cung cấp “cái nhìn tổng quát” cho người đọc biết về đối tượng nghiên cứu của mẫu dữ liệu. Ví dụ: Trong toàn bộ mẫu dữ liệu thì có bao nhiêu người là nữ giới, bao nhiêu người có trình độ đại học, bao nhiêu người làm ở Phòng kinh doanh v... Cách làm:  Bước 1: Mở phần mềm SPSS, chọn File  Open  Data. Hộp Open Data xuất hiện, trong mục Look in bạn chỉ tới đường dẫn đã lưu file *.sav đã thực hiện ở mục 5. Rồi chọn Open.  Bước 2: Phân tích thống kê mô tả cơ bản về từng biến

o Chọn Analyze  Descriptive Statistics  Descriptives.. o Hộp Descriptives xuất hiện. Chọn biến cần phân tích thống kê mô tả [ví dụ: chọn biến gioitinh], nhấn “ ” để chuyển biến “gioitinh” sang ô Variable[s]. o Chọn ô Options, hộp Descriptive: Options hiện lên, trong đó ý nghĩa của các tùy chọn là  Mean: là giá trị trung bình của biến  Sum: là tính tổng của tất cả các quan sát trong mẫu dữ liệu  Std: là độ lệch chuẩn  Maximum: là giá trị lớn nhất  Minimum: là giá trị nhỏ nhất  Variance: là giá trị phương sai  Range: là khoảng biến thiên [= Maximum – Minimum]  Kurtosis: là độ nhọn của mẫu dữ liệu [theo dạng phân phối chuẩn]  Skewness: là độ nghiêng của mẫu dữ liệu [theo dạng phân phối chuẩn]  Tùy theo yêu cầu của giáo viên hướng dẫn hoặc tạp chí thì cách chọn thông thường giống hình minh họa.  Ấn Continue o Các ô Style và Bootstrap để mặc định [không sử dụng]

 Bước 4: Nhấn OK rồi đọc kết quả Lưu ý: Bạn có thể lồng ghép nhiều yêu cầu phân tích tổng hợp vào cùng 1 bảng. Như kết hợp các biến định tính với nhau, kết hợp các biến định lượng với nhau, hoặc kết hợp cả biến định tính và biến định lượng. Việc này giúp mức độ tổng hợp thông tin tốt hơn  Bài nghiên cứu được đánh giá cao/chuyên nghiệp hơn.

chmon Trung cấp Cao đẳng Đại học Sau đại học Count Count Count Count gioitinh Nam giới 11 3 87 3 Nữ giới 3 8 82 3 7. Kiểm định độ tin cậy của thang đo [Kiểm định Cronbach’s Alpha] Nếu các câu hỏi trong cùng một thang đo có tương quan mạnh với nhau thì thang đo đó được đánh giá là thang đo tốt [Hair và cộng sự [2009]]. Để đo lường mức độ tương quan này, người ta sử dụng hệ số α do Cronbach đề xuất theo công thức: . 1 .[ 1]

N N      

Trong đó: ρ [đọc là prô] là hệ số tương quan trung bình giữa các câu hỏi. N là số lượng câu hỏi trong một thang đo. Để tính được hệ số α thì số lượng câu hỏi trong 1 thang đo phải ≥ 3, nhưng cũng không nên quá nhiều vì hệ số α không cung cấp được thông tin là câu hỏi nào nên loại bỏ hoặc câu hỏi nào nên giữ lại. Cách tính toán hệ số α của Cronbach trên SPSS như sau:

 Bước 1: Chọn Analyze  Scale  Reliability Analysis  Bước 2: Chọn lần lượt tất cả các câu hỏi trong cùng 1 thang đo [giữ phím Ctrl + click chuột trái chọn từng câu hỏi]. Rồi ấn “” để đưa tất cả các câu hỏi đã chọn

sang ô Items.  Bước 3: Trong mục Statistics, bắt buộc phải chọn ô Scale if item deleted, ấn Continue.  Bước 4: Chọn OK rồi đọc kết quả

Reliability Statistics Cronbach's Alpha N of Items . 805 4

Item-Total Statistics Scale Mean if Item Deleted

Scale Variance if Item Deleted

Corrected Item- Total Correlation

Cronbach's Alpha if Item Deleted work1 14 14. 644. work2 14 14. 659. work3 14 13. 673. work4 14 15. 510.  Bước 5: Làm lần lượt cho từng thang đo của các biến độc lập và biến phụ thuộc trong mô hình. Ghi lại tất cả những câu hỏi hợp lệ để chuyển sang bước phân tích tiếp theo.

 Bước 3: Thiết lập các thông số cho phân tích EFA o Trong hộp Descriptives, bắt buộc phải chọn ô “KMO and Bartlett’s test of sphericity”  Nhấn Continue. o Trong hộp Extraction, mục Method chọn phương pháp “Principal components”  Nhấn Continue. o Trong hộp Rotation, Varimax là phép xoay ma trận đối xứng, Promax là phép xoay ma trận không đối xứng. Chúng ta chọn phép xoay Varimax  Nhấn Continue. o Trong hộp Scores chúng ta để chế độ mặc định [tức là không sử dụng hộp này]. o Trong hộp Option,  Tích chọn ô: Sorted by size  Tích chọn ô: Suppress small coefficients  Ô Absolute value below: Nhập giá trị là 0.  Nhấn Continue  Bước 4: Nhấn OK rồi đọc kết quả

KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy.

. 864

Bartlett's Test of Sphericity

Approx. Chi-Square 3593. df 496 Sig.. 000

Rotated Component Matrixa Component 1 2 3 4 5 6 7 prom1. prom3. prom2. prom4. work4. sup6. sup5. sup3. sup7. sup4. sup2. sup 1 pay4. pay5. pay2.

công thức trên ta có thể hệ số tương quan sẽ giao động trong khoảng [-1; 1]. Ý nghĩa thực tế là:  Nếu r < 0, hàm ý khi X tăng thì Y sẽ giảm [quan hệ ngược chiều]  Nếu r > 0, hàm ý khi X tăng thì Y sẽ tăng [quan hệ thuận chiều]  Nếu r ≈ -1 hoặc r ≈ 1 thì giữa X và Y có tương quan mạnh  Nếu r = 0 thì giữa X và Y không có mối quan hệ [hàm ý X thay đổi, nhưng Y không thay đổi]. Khi hệ số tương quan r ≠ 0 thì giữa X và Y có thể tồn tại mối liên hệ, do vậy cách xác định hệ số tương quan trên SPSS thực hiện như sau: 9. Tạo các biến độc lập Ở bước 7 mục 8, chúng ta đã xác định được các câu hỏi hợp lệ cuối cùng được giữ lại. Bước tiếp theo là tạo ra các biến độc lập và biến phụ thuộc từ các câu hỏi được giữ lại đó. Cách làm như sau:  Bước 1: Chọn Transform  Compute Variable  Bước 2: Hộp Compute Variable xuất hiện, chúng ta nhập công thức như sau o Giả sử sau phân tích EFA, đối với yếu tố công việc chúng ta giữ lại các câu hỏi gồm work1, work 2, work3. Tương tự yếu tố thu nhập [pay1, pay2, pay3, pay4, pay5]; yếu tố phúc lợi [ben1, ben2, ben3]; yếu tố cơ hội thăng tiến [prom1, prom2, prom3, prom4]; yếu tố đồng nghiệp [cow1, cow2, cow3]; yếu tố hỗ trợ của lãnh đạo [sup3, sup4, sup5, sup6, sup7]. o Trong ô Target Variable: Nhập tên của biến [tiếng việt, viết liền, không có dấu]. Ví dụ: CV là công việc, DN là đồng nghiệp, PL là phúc lợi ... o Trong ô Numeric Expression: Nhập công thức để tính  Ví dụ: Biến CV = [work1 + work2 + work3]/3  Chọn OK Biến LD = [sup3 + sup4 + sup5 + sup6 + sup7]/5  Chọn OK  Lưu ý: biến còn bao nhiêu câu hỏi hợp lệ thì chia cho số đó. Làm lần lượt cho từng biến độc lập  Tạo phụ thuộc [nên đặt tên biến phụ thuộc là Y] giống cách tạo biến độc lập

  1. Kiểm định hệ số tương quan Sau khi tạo được các biến độc lập và biến phụ thuộc, cần thực hiện thêm kiểm định tương quan giữa các biến độc lập để phát hiện 1 dạng khuyết tật thường gặp trong phương pháp ước lượng bình phương nhỏ nhất OLS [Ordinary Least Square], đó là hiện tượng đa cộng tuyến hoàn hảo [multicollinearity]. Cách làm như sau:  Bước 1: Chọn Analyze  Correlate  Bivariate  Bước 2: Hộp Bivariate Correlations xuất hiện, chọn những biến độc lập vừa được tạo ở mục 9 ấn “” đưa sang ô Variables.  Bước 3: Tích chọn o Kiểm định tương quan theo cách của Pearson đề xuất. o Two-tailed [kiểm định 2 phía]  Bước 4: Nhấn OK và đọc kết quả Lưu ý: Các hệ số tương quan trên đường chéo chính phải bằng 1 [hàm ý không thể tính được hệ số tương quan cho 1 biến]

Correlations CV TN PL DN TT LD CV Pearson Correlation

1 .461** .269** .453** .557** .488**

PRF: Yi   0   1. X1, i   2. X 2, i  ...  k .X k i, ui Trong đó: Yi là các giá trị thật của biến Y X1,i là các giá trị thật của biến X 1 .... ui được hiểu là sai số của phép ước lượng β0 được gọi là hệ số chặn hay tung độ góc [intercept] β 1 , β 2 , βk là các hệ số hồi quy [coefficient] biểu hiện cho tác động của X 1 , X 2 ,..., Xk tới Y. Đây là mục đích của nghiên cứu và là kết quả của phân tích hồi quy. Ứng dụng vào đề tài “Các yếu tố ảnh hưởng tới lòng trung thành của nhân viên tại Công ty XYZ”, dựa vào các nghiên cứu trước ta có thể đề xuất mô hình nghiên cứu [xem mục 8], đồng thời biểu diễn mô hình nghiên cứu đó dưới dạng phương trình toán học như sau: Lòng trung thành [i] = β 0 + β 1 .Yếu tố công việc [i] + β 2 .Yếu tố thu nhập [i] + β 3 .Yếu tố phúc lợi [i] + β 4 .Yếu tố môi trường làm việc [i] + β 5 .Yếu tố đồng nghiệp [i] + β 6 .Yếu tố cơ hội thăng tiến [i] + β 7 .Yếu tố sự hỗ trợ của lãnh đạo [i] + ui. Tuy nhiên do việc biết và thu thập được dữ liệu của tổng thể là bất khả thi. Do vậy, người nghiên cứu phải thu thập dữ liệu mẫu. Khi đó phải xây dựng hàm hồi quy mẫu. Hàm hồi quy mẫu SRF [Sample Regression Function] là hàm biểu diễn mối quan hệ giữa các biến độc lập [X 1 , X 2 , X 3 ..] tác động đến biến phụ thuộc [Biến Y] theo một dạng hàm số nhưng cho dữ liệu mẫu.

SRF: Yi   0   ˆ 1. X 1, i  ˆ 2. X 2, i  ...  ˆk .X k i, ei Công việc chính của người nghiên cứu là đi tính toán các hệ số  ˆ 1 , ˆ 2 ,..., ˆk rồi suy luận ra tổng thể. Để cách suy luận này đảm bảo được mức độ tin cậy thì các kết quả ước lượng thu được bằng phương pháp ước lượng bình phương nhỏ nhất OLS phải không vi phạm các khuyết tật sau:  Khuyết tật 1: Mô hình không xảy ra hiện tượng đa cộng tuyến hoàn hảo [multicollinearity] giữa các biến độc lập với nhau.  Khuyết tật 2: Mô hình không xảy ra hiện tượng tự tương quan [Auto Correlation]  Khuyết tật 3: Phần dư phép ước lượng phải tuân theo quy luật phân phối chuẩn ~ N[0,1]. Tức là giá trị trung bình = 0, và tổng phương sai =1.  Khuyết tật 4: Mô hình bị sai dạng hàm [Error functional form]  Khuyết tật 5: Mô hình có phương sai đồng nhất [homoskedasticity]

  1. Phân tích hồi quy bằng SPSS Sau khi đã tạo được các biến độc lập và biến phụ thuộc ở mục 9 [lưu ý là phải nhớ đúng tên biến độc lập và biến phụ thuộc], bước tiếp theo là phân tích hồi quy OLS. Cách làm;  Bước 1: Chọn Analyze  Regression  Linear.  Bước 2: Hộp Linear Regression xuất hiện o Ô Dependent: Chọn biến Y rồi ấn “” để khai báo Y là biến phụ thuộc o Ô Independent[s]: Chọn đồng thời tất cả các biến độc lập rồi ấn “” để khai báo tất cả các biến độc lập [lưu ý là không khai báo thiếu, cũng ko khai báo thừa]. o Ô Method: Chọn phương pháp Enter

 Bước 3: Thiết lập các định dạng cho phân tích hồi quy o Trong hộp Statistics chọn các ô Estimates; Model fit; Collinearity diagnostics; Durbin-Watson. Ấn Continue. o Các hộp còn lại không sử dụng  Bước 4: Nhấn OK rồi đọc kết quả

Chủ Đề