Những lỗi thường gặp khi phân tích efa

  • 1. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM PHÂN TÍCH NHÂN TỐ Factor analysis (FA) ỨNG DỤNG TIN HỌC HỖ TRỢ NGHIÊN CỨU KHOA HỌC VÀ HOẠT ĐỘNG XÂY DỰNG Đỗ Tiến Sỹ, Trần Nguyễn Nhật Nam TP. HCM. 09 - 2019
  • 2. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM 01 PHÂN TÍCH NHÂN TỐ (FA) 02 PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EFA) 03 HƯỚNG DẪN CHẠY EFA BẰNG SPSS 04 XỬ LÝ CÁC LỖI THƯỜNG GẶP ĐỊNH NGHĨA, MỤC ĐÍCH PHÂN LOẠI, MODELS ĐỊNH NGHĨA, MỤC ĐÍCH ỨNG DỤNG, ĐIỀU KIỆN ĐỂ THỰC HIỆN CÁC BƯỚC THỰC HIỆN TIÊU CHÍ ĐÁNH GIÁ MÔ HÌNH ĐỌC HIỂU CÁC THUẬT NGỮ, KẾT QUẢ CÁCH LOẠI BIẾN MA TRẬN XOAY XÁO TRỘN “ROTATION FAILED TO CONVERGE IN 25 ITERATIONS…” 05 Q&A, TRAO ĐỔI VỀ FA; GIỚI THIỆU SEM
  • 3. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM 1. Phân biệt được Phân tích nhân tố và các kỹ thuật phân tích đa biến khác 2. Phân biệt giữa Phân tích nhân tố khám phá (EFA) và khẳng định (CFA) 3. Nắm các bước để áp dụng Phân tích nhân tố 4. Mô tả được các các nhân tố được trích xuất 5. Hiểu được ý tưởng của việc xoay nhân tố 6. Biết cách đặt tên nhân tố 7. Nắm các nhược điểm của phương pháp này MỤC TIÊU KHÓA HỌC
  • 4. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM VÌ SAO CÓ FACTORS ANALYSIS − Gặp các “yếu tố ẩn” khó đo lường được (sự hài lòng, trung thành…) Thì chúng ta phải tìm nhiều câu hỏi khác, phản ánh yếu tố đó và đo lường được. Phát sinh VOs Câu hỏi 1 Câu hỏi 2 Câu hỏi 3 Ảnh hưởng VOs Câu hỏi 4 Câu hỏi 5 Câu hỏi 6 ? ? ? ? ? ? YẾU TỐ “ẨN BIẾN DỮ LIỆU
  • 5. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM PHÂN TÍCH NHÂN TỐ (FA) − Dùng để rút gọn một tập gồm nhiều biến quan sát phụ thuộc lẫn nhau thành một tập biến (gọi là các nhân tố) ít hơn để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu (Hair, 1998) − Dựa trên cấu trúc liên hệ ngầm (underlying structure) giữa các biến Keywords: 1. So sánh với hồi quy bội 2. Factor analysis = Interdependence Technique 3. Các biến không thể đo lường trực tiếp 4. Thu nhỏ và tóm tắt
  • 6. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM PHÂN TÍCH NHÂN TỐ (FA) − Các biến đóng vai trò quan trọng trong kỹ thuật phân tích đa biến − Ví dụ: Chúng ta xây dựng một dự đoán doanh thu bằng hồi quy. − Mục đích trả lời câu hỏi doanh nghiệp thành công hay thất bại − Công cụ sử dụng hồi quy, hoặc các công cụ phân tích khác. − Cần có các biến để thành lập mối quan hệ (sản lượng, giá cả, nhu cầu, sức khỏe môi trường kinh doanh…) − Các biến giúp xây dựng các mối quan hệ. − Tùy bản chất của nghiên cứu, số lượng biến sẽ tăng. − Phân tích đa biến cho phép phân tích hàng trăm, ngàn biến. − Nhưng nếu quá nhiều biến sẽ có khả năng bị lặp, “giống” nhau → phải quản lý, nhóm các biến tương quan mạnh, đặt tên, giảm số lượng.
  • 7. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM PHÂN TÍCH NHÂN TỐ (FA) Hai mục đích chính khi phân tích nhân tố: 1. Phát triển lý thuyết Phát hiện và kiểm tra cấu trúc liên hệ giữa các biến, xác định, phân loại nhân tố (Identify and classify variables) 2. Thu gọn dữ liệu Đơn giản hóa một tập hợp các biến (Variables) phức tạp ban đầu thành một tập các biến nhỏ hơn dưới dạng các nhân tố (Factors) Phải lưu ý tới mức độ mất mát dữ liệu khi tiến hành FA
  • 8. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM PHÂN TÍCH NHÂN TỐ (FA) Có hai loại phân tích nhân tố 1. Phân tích nhân tố khẳng định (Confirmatory Analysis) Kiểm tra cấu trúc quan hệ giả thuyết (Hypothesized structure) và đánh giá mức độ phù hợp của mô hình (Goodness of fit). 2. Phân tích nhân tố khám phá (Exploratory Factor Analysis) Khám phá và tổng hợp các mối quan hệ tiềm ẩn của bộ dữ liệu * Buổi học hôm nay tập trung vào loại 2. CFA và SEM (Structural equation modeling) được sử dụng khá nhiều, nhưng phức tạp hơn, sẽ được giới thiệu vào buổi sau.
  • 9. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM MÔ HÌNH FA ĐƠN GIẢN VÀ PHỨC TẠP Hướng nội / Hướng ngoại Tâm lý bất ổn Tâm thần Ví dụ: Một nghiên cứu về tính cách con người cho KQ như trên − 12 biến được rút gọn thành 3 nhân tố cơ sở − Các nhân tố gồm các biến tương đồng nhau [Source: Eysenck’s 3 personality factors] Nói nhiều Ngại ngùng Hòa đồng Vui vẻ Lo lắng Ảm đạm Căng thẳng Mệt mỏi Lảng tránh Cục cằn Dị biệt Bạo lực
  • 10. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM MÔ HÌNH FA ĐƠN GIẢN VÀ PHỨC TẠP Factor 1 Factor 2 Factor 3 Item 1 Item 2 Item 3 Item 4 Item 5 Factor 1 Factor 2 Factor 3 Item 1 Item 2 Item 3 Item 4 Item 5 Mỗi biến đo lường chỉ đặt hệ số tải (loading factor) lên 1 nhân tố Mỗi biến đo lường có thể đặt hệ số tải (loading factor) lên 1, 2, 3.. nhân tố Mô hình FA đơn giản Mô hình FA phức tạp
  • 11. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EFA) EFA sử dụng trong các trường hợp cơ bản sau đây: 1. Để giảm một số lượng lớn các biến thành các nhân tố nhỏ hơn 2. Để chọn một tập hợp nhỏ các biến từ một tập hợp lớn ban đầu 3. Để tạo ra một tập hợp các nhân tố, mà tập hợp các nhân tố này được xem như là các biến không có tương quan với nhau. Đây chính là một cách tiếp cận để xử lý vấn đề đa cộng tuyến (Multicollinearity) trong mô hình hồi quy bội. 4. Để xác định tính hợp lệ của thang đo.
  • 12. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EFA) - Nhân tố chung có thể được diễn tả như những tổ hợp tuyến tính của các biến đo lường, điều này được thể hiện thông qua mô hình sau đây: Fi = Wi1*X1 + Wi2*X2 + Wi3*X3 + . . . + Wik*Xk - Trong đó: + Fi : ước lượng trị số của nhân tố i + Wi : quyền số hay trọng số nhân tố (Factor scores coefficient) + k : số biến + Xi : các biến quan sát
  • 13. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM SỐ LƯỢNG MẪU CẦN THIẾT Quy tắc Reference Rule of 100 Gorsuch (1983), Kline (1979) Rule of 200 Guilford (1954) Rule of 500 Comrey và Lee (1992) Subjects-to-variables (STV) ratio 20:1 Hair, Anderson, Tatham, và Black (1995) 10:1 David Garson (2008); Everitt (1975) [4, 5]:1 Bryant và Yarnold (1995) 3:1 ( > 250) Cattell (1978) - Ví dụ: có 20 biến, cần ít nhất 20 x 5 = 100 mẫu (theo Bryant) - Không có con số giới hạn trên, số lượng biến càng nhiều, coverage cao… sẽ cho kết quả càng tốt. - GABAGE IN GABAGE OUT
  • 14. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM TRÌNH TỰ THỰC HIỆN EFA Thiết kế nghiên cứu Phám phá? Khẳng định? Bao gồm những biến nào? Cỡ mẫu?... Principal Component Analysis Common factor Analysis Nhân tố chính Maximum Likelihood Factor (Nhân tố hợp lý cực đại) Số lượng nhân tố: Quy luật của Kaiser-Guttman Screen test / Plot Chỉ tiêu tổng phương sai giải thích Phương pháp trích xuất Phương pháp xoay Trực giao Varimax Equamax Quartimax Xiên Promax Direct Oblimin Thu thập dữ liệu 1:5 GIGO Xây ma trận tương quan
  • 15. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM TRÌNH TỰ THỰC HIỆN EFA Xác định cỡ mẫu Khảo sát, lọc kết quả thô Phân tích độ tin cậy Cronback’s Alpha Kiểm tra giả thuyết Tính ma trận tương quan (Correlation matrix) 0 1 2 3 4 5 Extracting factors Rotating factors Loại biến và đặt tên Factors
  • 16. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM KIỂM TRA GIẢ THIẾT - Barlett test of sphericity Xem xét giả thuyết H0: “Ma trận tương quan có phải là ma trận đơn vị (identity matrix)” Nếu phép kiểm định Bartlett có p < 5%, chúng ta có thể từ chối giả thuyết H0 (ma trận tương quan là ma trận đơn vị), có nghĩa là các biến có quan hệ với nhau. - (*) Ma trận đơn vị là ma trận có đường chéo chính bằng 1 và tất cả những phần tử khác đều bằng 0
  • 17. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM KIỂM TRA GIẢ THIẾT - K.M.O. Measure of Sampling Adequacy Là một chỉ tiêu để xem xét sự thích hợp của FA Nếu 0.5 ≤ KMO ≤1 thì phân tích nhân tố là thích hợp Khoảng Đánh giá >= 0.9 Rất tốt [0.8, 0.9) Tốt [0.7, 0.8) Được [0.6, 0.7) Tạm được [0.5, 0.6) Tệ < 0.5 Không chấp nhận được [Source: Kaiser, H. F. (1974). An index of factorial simplicity]
  • 18. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM TRÍCH XUẤT NHÂN TỐ - Mục tiêu ở bước này là xác định các nhân tố. - Phương pháp thường hay sử dụng là Trích xuất thành phần chính (Principal components analysis). O Var 1 (…,…,…) Var 2 (…,…,…) Var 3 (…,…,…) Var 4 (…,…,…) Var 5 (…,…,…) Var 6 (…,…,…) Var 7 (…,…,…) Var p (…,…,…) D1=F1 (Var) D2=F2 (Var) D3=F3 (Var) Thuật toán: Trục thành tố được xác định theo phương pháp phương sai của các hình chiếu biến ban đầu xuống trục thành tố chính là cực đại
  • 19. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM TRÍCH XUẤT NHÂN TỐ - PCA - Principal Components Analysis + Giảm “biến” (data reduction) -> tạo ra biến “tổng hợp” (composite variable) mà không mất thông tin. + The 1st principal component là phức hợp giải thích được nhiều biến thiên nhất trong quần thể nhất Cần ít nhất bao nhiêu phép chiếu để mô tả con lạc đà? Lưu ý: 1. PCA chỉ phù hợp với dữ liệu số 2. Rất nhạy cảm với dữ liệu bất thường Outlier 3. Không phù hợp với các mô hình phi tuyến.
  • 20. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Ví dụ 1: Đánh giá các nhân tố gây ra phát sinh thay đổi (Variation Order) (dựa trên thang đo Likert 7 điểm 1 = không ảnh hưởng tới 7 = cực kỳ ảnh hưởng) TRÍCH XUẤT NHÂN TỐ Nguyên nhân 1 2 3 4 5 6 7 AF1 Nhà thầu thay đổi biện pháp thi công AF2 Thay đổi thiết kế, chỉ tiêu kỹ thuật AF3 (SOW) không được xác định rõ ràng, đầy đủ AF4 Thay đổi quy chuẩn, tiêu chuẩn AF5 Fast track AF6 Không có kế hoạch chiến lược AF7 Tư vấn thiết kế bị lỗi và thiếu sót AF8 Liên lạc, thông tin giữa các bên kém AF9 Thay thể vật liệu, quy trình AF10 Giám sát và quản lý công trường kém AF11 Tư vấn thiếu hiểu biết về vật liệu, thiết bị sẵn có
  • 21. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM TRÍCH XUẤT NHÂN TỐ [0.8, 0.9): Tốt Significant p < 0.05
  • 22. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Căn cứ để xác định số factors được giữ lại: - Eigenvalues > 1 (Latent root) - Tổng phương sai trích Variance extracted >= 50% (Anderson & Gerbing, 1988) TRÍCH XUẤT NHÂN TỐ - Nếu Eigenvalue giảm xuống dưới 1 có nghĩa là nhân tố đó giải thích phương sai kém hơn so với 1 biến đơn lẻ Trước trích xuất Sau trích xuất Sau khi xoay % of Var thay đổi? Từ 11 biến ban đầu, chỉ còn lại 3 nhân tố có Eigenvalue > 1 còn giữ lại
  • 23. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Căn cứ để xác định số factors được giữ lại: - Scree Plot: chú ý khu vực có độ dốc lớn. TRÍCH XUẤT NHÂN TỐ Elbow: khuỷu tay
  • 24. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Eigenvalues (trị riêng) và Eigenvector (vector riêng) là cơ sở cho các phương pháp FA để giảm chiều dữ liệu (dimensionality reduction) nhằm mô tả dữ liệu ngắn gọn. TRÍCH XUẤT NHÂN TỐ - Vector: hướng và độ lớn - Line best fit chỉ hướng của đa số phương sai dữ liệu. Eigenvector rút gọn và chỉ phương của line đó. Còn eigenvalues là một số cho biết data set trải ra trên line đó như thế nào. - Khi giảm chiều dữ liệu như vậy, chuyện gì xảy ra? Nhân tố mới đại diện các biến ban đầu TỐT như thế nào?
  • 25. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XOAY NHÂN TỐ - Sau khi trích nhân tố, giá trị Factor loading được tính ra. - Khi tiến hành xoay, phương sai (Variance) được phân bố lại do đó hệ số tải loading cũng như phần trăm phương sai trích (Percentage of variance) cũng thay đổi theo. - Mục đích của bước này: phân bố lại phương sai từ nhân tố ban đầu thành các nhân tố đơn giản hơn nữa, có ý nghĩa và dễ giải thích hơn. Factor 1 Var 1 Var 2 Var 1
  • 26. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XOAY NHÂN TỐ - Có 2 phương pháp xoay nhân tố + ∕Orthogonal Trực giao (SPSS Varimax) Các nhân tố mới không liên quan với nhau Oblique Xiên (SPSS Oblimin) Cho phép nhân tố liên quan với nhau
  • 27. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XOAY NHÂN TỐ - QUARTIMAX: Hàng được đơn giản hóa để biến được tải trên một yếu tố duy nhất. - VARIMAX (thường dùng): Được sử dụng để đơn giản hóa cột của ma trận nhân tố sao cho các trích xuất nhân tố được liên kết rõ ràng và cần có sự tách biệt giữa các biến. - EQUIMAX: kết hợp 2 phương pháp trên. Thường sử dụng Varimax. Equimax hoặc Promax: SEM
  • 28. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XOAY NHÂN TỐ - Sau khi xoay nhân tố, phải kiểm tra mức độ ý nghĩa (significant) của factor loading. Theo Hair et al (1998) con số đó phụ thuộc vào cỡ mẫu của nghiên cứu. Cụ thể: Giá trị đề nghị Cỡ mẫu Min 0.30 350 0.35 250 0.40 200 0.45 150 0.50 100 0.60 85 0.65 70 0.70 60 0.75 50
  • 29. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM HIỆU CHỈNH VÀ ĐẶT TÊN NHÂN TỐ - Hiệu chỉnh: dựa trên mức độ tin cậy thang đo (Cronback’s Alpha), chuẩn xác nghiên cứu (Construct validity) cũng như các hệ số đo lường hội tụ ở trên. - Đặt tên nhân tố: cuối cùng các biến tương đồng với nhau sẽ được nhóm cụm lại, sắp xếp theo mức độ tương quan. Do vậy biến với hệ số loading cao nhất thường được dùng để đặt tên nhóm. - Lưu ý khi đặt tên nhân tố: + Thể hiện được ý nghĩa của tất cả các biến + Các nhân tố không được tương đồng với nhau + Factor này có phù hợp không? So với các nghiên cứu trước đây?
  • 30. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM HIỆU CHỈNH VÀ ĐẶT TÊN NHÂN TỐ - Nhân tố “tốt, đẹp”: + Có ý nghĩa (make sense) + Dễ hiểu, giải thích + Cấu trúc đơn giản + Không có các factor loading phức tạp
  • 31. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM THỰC HIỆN EFA TRONG SPSS MÃ NGUYÊN NHÂN MỨC ĐỘ ẢNH HƯỞNG 1 2 3 4 5 EF1 Giảm năng suất lao động EF2 Trễ tiến độ hoàn thành EF3 Tranh chấp giữa Chủ đầu tư và nhà thầu EF4 Giảm chất lượng dự án EF5 Vượt chi phí dự án EF6 Tăng lợi nhuận của nhà thầu EF7 Gây chậm trễ trong quy trình cung cấp vật liệu, thiết bị EF8 Làm xuất hiện nhưng hoạt động không có giá trị cho dự án EF9 Tăng chi phí của nhà thầu EF10 Xuất hiện công tác phải làm lại EF11 Gây chậm thanh toán cho nhà thầu EF12 Làm xuất hiện các quy trình không cần thiết EF13 Gây mất an toàn lao động Ví dụ 2: Đánh giá các tác động gây ra phát sinh thay đổi (Variation order) (dựa trên thang đo Likert 5 điểm)
  • 32. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM THỰC HIỆN EFA TRONG SPSS - Bảng khảo sát (Google Doc) với thang đo Linkert 5 điểm - 152 bảng khảo sát hợp lệ được mã hóa và nhập vào SPSS - Bảng hiển thị các biến dữ liệu
  • 33. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM THỰC HIỆN EFA TRONG SPSS - Lưu ý: trước giai đoạn này, dữ liệu đã phải được làm sạch và kiểm tra độ tin cậy của thang đo, tránh biến rác (Artificial factors)  NHẮC LẠI VỀ CRONBACK’S ALPHA: - Vào menu Analyze / Scale / Reliability Analysis - Nằm trong khoảng [0.6, 0.9] - Quy tắc loại biến: + Hệ số tương quan biến tổng bé hơn 0.3 (Nunnally, 1994) + Hệ số Cronbach's alpha if item deleted lớn hơn hệ số Cronbach hiện tại + Biến nào trong file data bị loại do Cronback’s Alpha?
  • 34. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM THỰC HIỆN EFA TRONG SPSS - B1: Kiểm tra điều kiện để thực hiện EFA - Analyze / Data Reduction / Factor.
  • 35. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Đưa 12 biến vào “Variables”, sau đó chọn “Descriptives” THỰC HIỆN EFA TRONG SPSS Cho biết hệ số tương quan của tất cả các biến - Hộp thoại Descriptive giúp xác định các tham số thống kê mô tả cần tính: thống kê mô tả từng biến, phương án nhân tố ban đầu, kiểm định KMO Barllette và tính hệ số tương quan
  • 36. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Continue, ta có kết quả sau: THỰC HIỆN EFA TRONG SPSS - Ta thấy KMO = 0.759 > 0.50, thõa mản yêu cầu để thực hiện EFA. Hơn nữa, theo Kaiser (1974), nếu KMO > 0.70 : ĐƯỢC. - Sig. = 0.000 < 0.05, ta có thể từ chối giả thuyết H0 (ma trận tương quan là ma trận đơn vị), có nghĩa là các biến có quan hệ với nhau nên ta có thể thực hiện EFA. - Như vậy, với kết quả i), ii) thì dữ liệu này phù hợp để thực hiện EFA. Có ĐỦ chỉ tiêu cho mỗi factor
  • 37. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - B2: Rút trích nhân tố - Analyze / Data Reduction / Factor. THỰC HIỆN EFA TRONG SPSS I II III IV
  • 38. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Chọn “Extraction…”, sau đó ta chọn các thông số như sau: THỰC HIỆN EFA TRONG SPSS - Hộp thoại Extraction cho phép: + Chọn phương pháp rút trích (default là rút các thành phần chính, PC) + Thể hiện ma trận chưa xoay, vẽ biểu đồ dốc. + Tiêu chuẩn rút trích. I B1 B2 B3 B4 B5
  • 39. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Chọn “Rotation…”, sau đó ta chọn các thông số như sau: THỰC HIỆN EFA TRONG SPSS - Trong hộp Rotation, đánh dấu Varimax nếu phương pháp là Principle components - Hộp thoại Rotation cho phép: + Chỉ định phương pháp xoay nhân tố. + Vẽ các nhân tố. + Số lần thực hiện tối đa để hội tụ phép xoay. II B56 B7 B8
  • 40. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Chọn “Scores…”, sau đó ta chọn các thông số như sau: THỰC HIỆN EFA TRONG SPSS - Chọn Save as variables nếu bạn muốn lưu lại nhân số (đã chuẩn hóa) của từng nhân tố - Hộp thoại Factor Scores cho phép: + Chọn phương pháp tính nhân tố (factor score) + Chọn thể hiện bảng trọng số nhân tố. + Sử dụng bảng dữ liệu này nếu có dùng ANOVA, tương quan, hồi quy III B10 B9
  • 41. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Chọn “Options…”, sau đó ta chọn các thông số sau: THỰC HIỆN EFA TRONG SPSS - Chọn “Sorted by size” nếu muốn sắp xếp các biến quan sát trong cùng một nhân tố đứng gần nhau. - Chọn “Suppress absolute value less than”, giá trị tuyệt đối nhỏ hơn sẽ không hiển thị (ví dụ 0.47..). Trong trường hợp muốn xuất nhiều factor loading, có thê giảm giá trị đó xuống thấp (0.2, 0.1…) - Chênh lệch loading giữa 2 nhân tố phải lớn hơn 0.3 IV B11 B12
  • 42. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM THỰC HIỆN EFA TRONG SPSS Hệ số đồng nhất - Mỗi biến sẽ có một hệ số đồng nhất (Communality), đó chính là phần trăm phương sai biến được giải thích bởi nhân tố trích xuất mới. - Chạy từ 0 (không có phương sai nào được giả thích) tới 1 (tất cả phương sai được giả thích) - High communalities (> .5)Vì sao hệ số đồng nhất khi chưa trích xuất lại bằng 1?
  • 43. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XOAY NHÂN TỐ Trường hợp này giải thích được bao nhiêu % và bị thất thoát bao nhiêu % ?
  • 44. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XỬ LÝ CÁC LỖI THƯỜNG GẶP D= 0.303 D= 0.239 D= 0.142 D=0.237 - Ma trận xoay bị xáo trộn, không hội tụ - Xem xét lại số liệu - Lần lượt loại biến tải lên trên 2 nhân tố và chênh lệch FL < 0.3. Lưu ý các biến quan trọng của nghiên cứu. (chọn Delta FL Min) EF12, 10, 9 và 13 tải lên 2 nhân tố? FL: hệ số tải nhân tố là hệ số tương quan đơn giữa biến và nhân tố
  • 45. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XỬ LÝ CÁC LỖI THƯỜNG GẶP 3 nhân tố giải thích 70,4% phương sai của 13 biến ban đầu. Rất hiệu quả Một căn cứ để đánh giá nghiên cứu: nhân tố mới giải thích phần lớn phương sai, ít bị mất dữ liệu (loss of data) MAXIMUM VARIANCE USING FEWEST FACTORS Trị riêng Tổng 100% Số trục chính Nhân tố “yếu” Nhân tố “mạnh”
  • 46. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XỬ LÝ CÁC LỖI THƯỜNG GẶP - CÁC PHÂN TÍCH SAU KHI THỰC HIỆN EFA: + Tiến hành các phân tích thông thường khác: ANOVA, Regression. Nâng cao CFA, SEM. + Có thể dùng nhân số chuẩn hoặc tính nhân số FL: hệ số tải nhân tố là hệ số tương quan đơn giữa biến và nhân tố Nhân tố Biến
  • 47. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM XỬ LÝ CÁC LỖI THƯỜNG GẶP - Lỗi khi chạy EFA: "Rotation failed to converge in 25 iterations...". - Nghĩa là dữ liệu chưa thể hội tụ được sau 25 bước lặp. - Cách xử lý là khi chạy EFA, vào "Extraction" và chỉnh "Maximum iteration for convergence" từ 25 lên 40, 50... rồi chạy lại EFA.
  • 48. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM Q&A, DISCUSSION - Cần tránh bị dẫn dắt bởi Loading factor. Phải suy nghĩ cẩn thận. - So sánh với lý thuyết và thực tế để đưa ra cấu trúc nhân tố cuối cùng. - Phải hiểu và giải thích được nhân tố mình chọn. - ‘Seeing what you want to see’ 1. GIẢI THÍCH NHÂN TỐ:
  • 49. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM - Bare Min. = 2 - Khuyết nghị Min.=3 - Max.= không giới hạn - Càng nhiều biến: → ↑ mức độ tin tưởng (Reliability) → ↑ mức độ đầy đủ (Roundedness) → ↑ quy luật Hiệu suất giảm dần (Diminishing returns) Điển hình, 4 -> 10 biến là hợp lý 2. BAO NHIÊU BIẾN 1 NHÂN TỐ THÌ ĐƯỢC? Q&A, DISCUSSION
  • 50. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM Là quy trình chủ quan, lưu ý: - Giá trị factor loading (tùy cỡ mẫu, Min. = 0.4 200 samples) (xem Hair et al, 1998) - Chêch lệch Loading < 0.3 - Ý nghĩa và sự đóng góp của biến đó trong nhân tố - Mỗi lần chỉ loại 1 biến và chạy lại EFA - Số lượng biến đã có trong nhân tố 3. LÀM THẾ NÀO ĐỂ LOẠI BỚT BIẾN? Q&A, DISCUSSION
  • 51. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM 1. Factor Loading > 0,5 2. 0,5 < KMO < 1 3. Kiểm định Bartlett có Sig < 0,05 4. Phương sai trích Total Varicance Explained > 50% 5. Eigenvalue > 1 6. Chênh lệch FL giữa các biến phải lớn hơn 0.3 Ý nghĩa của mỗi điều kiện? Vì sao vậy? 4. TRONG EFA CẦN PHẢI ĐÁP ỨNG CÁC ĐIỀU KIỆN: Q&A, DISCUSSION
  • 52. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM Áp dụng EFA cho các mô hình phức tạp? Q&A, DISCUSSION
  • 53. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM Áp dụng EFA cho các mô hình phức tạp? Q&A, DISCUSSION SIMPLE MODEL COMPLICATED MODEL 1. Frequency 2. Descriptive 3. Cronbach’s Alpha 4. Exploratory Factoring Analysis (Principle Component – Varimax) 5. Correlation 6. Regression 1. Frequency 2. Descriptive 3. Cronbach’s Alpha 4. Exploratory Factoring Analysis (Principle Axis Factoring – Promax) 5. Confirmatory Factoring Analysis 6. Structural Equation Modeling SPSS AMOS, SmartPLS A B C D A B DC
  • 54. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM THỰC HÀNH 1. Truy cập: https://bit.ly/2JMNtyd 2. Tiến hành kiểm tra Cronbach’s Alpha và biện luận Kết quả. 3. Tiến hành phân tích nhân tố khám phá EFA: + 3.1 Kiểm tra điều kiện (Bartlett và KMO) và biện luận + 3.2 Rút trích nhân tố. + 3.3 Đặt tên và phân tích kết quả. + 3.4 Đề xuất kiến nghị
  • 55. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM ĐÁNH GIÁ KHÓA HỌC - Anh chị vui lòng truy cập https://bit.ly/2Zhgmrm - Những đánh giá của anh chị sẽ được giữ bí mật, chỉ phục vụ mục đích giảng dạy
  • 56. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM TÀI LIỆU THAM KHẢO 1. Trong H. et al (2008). Data analysis with SPSS. Hong Duc Inc. 2. Hair Jr., J. F. et al. (1998). Multivariate data analysis with readings. Englewood Cliffs, NJ Prentice-Hall. 3. Nunnally, J.C. (1978). Psychometric theory. McGraw-Hill. 4. Kaiser, H. F. (1974). An index of factorial simplicity. Psychometrika.
  • 57. WITH IBM SPSS FACTOR ANALYSIS (FA) WITH IBM SPSS ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM APPENDIX STT NHÂN TỐ ẢNH HƯỞNG MÃ HÓA 1 CĐT thay đổi kế hoạch, quy mô dự án AF1 2 Sai sót trong hồ sơ hợp đồng AF2 3 Trở ngại trong quá trình thúc đẩy ra quyết định AF3 4 Bản chất bảo thủ của chủ đầu tư AF4 5 Phạm vi công việc (SOW) không được xác định rõ ràng, đầy đủ AF5 6 Liên lạc, thông tin giữa các bên kém AF6 7 Thay thể vật liệu, quy trình AF7 8 Không có kế hoạch chiến lược AF8 9 Thay đổi thiết kế, chỉ tiêu kỹ thuật AF9 10 Tư vấn Thiếu hiểu biết về vật liệu, thiết bị sẵn có AF10 11 Nhà thầu thay đổi biện pháp thi công AF11 12 Tư vấn thiết kế bị lỗi và thiếu sót AF12 13 Xây dựng song song các công tác đường găng (Fast track) AF13 14 Nhà thầu không tham gia vào giai đoạn thiết kế AF14 15 Thay đổi thiết kế để tiết kiệm chi phí (Value engineering) AF15 16 Chậm gửi yêu cầu thông tin (RFI) AF16 17 Giám sát và quản lý công trường kém AF17 18 Yếu tố bất khả kháng AF18 19 Thay đổi quy chuẩn, tiêu chuẩn AF19 20 Cản trơ vì chính quyền AF20 Bảng A.1 Bảng mã hóa các các nhân tố ảnh hưởng đến thay đổi, phát sinh khối lượng