Cách tính cỡ mẫu nghiên cứu

Estimated reading time: 5 minutes

Có 2 phương pháp xác định cỡ mẫu:

Cỡ mẫu (Sample size)

Cỡ mẫu là Số đơn vị mẫu (người, hộ gia đình) được lựa chọn vào nghiên cứu.

  • Cỡ mẫu thường được tính toán dựa trên công thức tính cỡ mẫu với các tham số phù hợp.

Công thức tính cỡ mẫu (Sample size formula/equation)

Công thức tính cỡ mẫu dùng để xác định số đơn vị mẫu tối thiểu cần thiết cho một nghiên cứu.

Chú ý

Công thức tính cỡ mẫu phụ thuộc mục tiêu nghiên cứu, thiết kế nghiên cứu, biến số nghiên cứu, độ chính xác mong muốn …

Nghiên cứu với một kích thước mẫu càng lớn sẽ càng thể hiện được tính chất của tổng thể nhưng lại tốn nhiều thời gian và chi phí. Do vậy, việc chọn một kích thước mẫu phù hợp là rất quan trọng.

Hai phương pháp tìm cỡ mẫu (sample size)

  1. Theo phương pháp xác định chung

  2. Theo phương pháp xử lý

1. Theo phương pháp xác định chung

  • Không biết số lượng quần thể / số lượng quần thể chưa được cập nhật.
  • Đã biết (chính xác / khoảng) số lượng quần thể
  • Phương thức chọn mẫu ngẫu nhiên đơn giản

Không biết số lượng quần thể / số lượng quần thể chưa được cập nhật.

Dùng công thức tính của Cochran’s (1977). 1

$$n = \frac{Z^2}{4e^2}$$

Trong đó:

nn = số lượng cỡ mẫu tối thiểu

ZZ = khoảng tin cậy 95%, tại giá trị 1.96

ee = giới hạn mẫu bị lỗi (±5%)

Đã biết (chính xác / khoảng) số lượng quần thể - Simplified formula for proportions

Dùng công thức tính của Yamane (1967). 2

$$n = \frac{N}{1+Ne^2}$$

Trong đó:

nn = số lượng cỡ mẫu

NN = số lượng tổng quần thể

e e = giới hạn mẫu bị lỗi (±3%; ±5%; ±7%; ±10%)

  • khoảng tin cậy 95% và kết quả có ý nghĩa thống kê p= 0.5 được giả định

Phương thức chọn mẫu ngẫu nhiên đơn giản – simple random sampling

Sử dụng bảng kích cỡ mẫu của Krejcie and Morgan (1970). 3

Cách tính cỡ mẫu nghiên cứu

2. Theo phương pháp xử lý

  • Phân tích EFA
  • Phân tích regression

EFA

Theo Hair et al. (2006) chỉ ra mẫu tối thiểu (>50), tốt hơn (>100), tỉ lệ quan sát:biến đo lường (5:1)4

$$N = 5m$$

Trong đó:

N N = số lượng cỡ mẫu,

mm = số lượng câu hỏi đo lường

Note

1 biến đo lường cần tối thiểu 5 quan sát. Số quan sát hiểu một cách đơn giản là số phiếu khảo sát hợp lệ cần thiết;
Biến đo lường đơn giản là một câu hỏi đo lường trong bảng khảo sát.

Regression

Theo Tabachnick & Fidell (2007)5

$$N > 50 + 8m$$

Trong đó:

NN = số lượng cỡ mẫu

mm = số biến độc lập


cỡ mẫu, quần thể, sample size, population

1. Yếu tố ảnh hưởng tới quyết định chọn cỡ mẫu

Kích thước mẫu (cỡ mẫu) của nghiên cứu càng lớn, sai số trong các ước lượng sẽ càng thấp, khả năng đại diện cho tổng thể càng cao. Tuy nhiên, việc thu thập cỡ mẫu lớn sẽ làm tiêu tốn nhiều thời gian, công sức, tiền bạc ở toàn bộ các khâu từ thu thập, kiểm tra, phân tích. Do đó việc xác định kích thước mẫu trong nghiên cứu cần phải được xem xét một cách có cân nhắc để mọi thứ được cân bằng và hiệu quả. Sự lựa chọn cỡ mẫu sẽ phụ thuộc vào:

  • Độ tin cậy cần có của dữ liệu. Nghĩa là mức độ chắc chắn rằng các đặc điểm của cỡ mẫu được chọn phải khái quát được cho đặc điểm tổng thể.
  • Sai số mà nghiên cứu có thể chấp nhận được. Đó là độ chính xác chúng ta yêu cầu cho bất ký ước lượng được thực hiện trên mẫu.
  • Các loại kiểm định, phân tích sẽ thực hiện. Một số kỹ thuật thống kê yêu cầu cỡ mẫu phải đạt một ngưỡng nhất định thì các ước lượng mới có ý nghĩa.
  • Kích thước của tổng thể. Mẫu nghiên cứu sẽ cần chiếm một tỷ lệ nhất định so với kích thước của tổng thể.

2. Xác định cỡ mẫu theo ước lượng tổng thể

Theo Yamane Taro (1967), việc xác định kích thước mẫu sẽ được chia làm hai trường hợp: không biết tổng thể và biết được tổng thể.

2.1 Kích thước mẫu trường hợp không biết quy mô tổng thể

Chúng ta sẽ sử dụng công thức sau:

Cách tính cỡ mẫu nghiên cứu

Trong đó:

  • n: kích thước mẫu cần xác định.
  • Z: giá trị tra bảng phân phối Z dựa vào độ tin cậy lựa chọn. Thông thường, độ tin cậy được sử dụng là 95% tương ứng với Z = 1.96.
  • p: tỷ lệ ước lượng cỡ mẫu n thành công. Thường chúng ta chọn p = 0.5 để tích số p(1-p) là lớn nhất, điều này đảm bảo an toàn cho mẫu n ước lượng.
  • e: sai số cho phép. Thường ba tỷ lệ sai số hay sử dụng là: ±01 (1%), ±0.05 (5%), ±0.1 (10%), trong đó mức phổ biến nhất là ±0.05.

Ví dụ: Nghiên cứu sự hài lòng của khách hàng đã dùng sản phẩm nước giải khát Pepsi tại TP.HCM. Đây là tổng thể không xác định được quy mô vì chúng ta không biết được có bao nhiêu khách hàng đã uống nước Pepsi ở TP.HCM. Như vậy cỡ mẫu tối thiểu cần có của nghiên cứu sẽ là 385 người:

Cách tính cỡ mẫu nghiên cứu

2.2 Kích thước mâu trường hợp biết quy mô tổng thể

Chúng ta sẽ sử dụng công thức tính cỡ mẫu sau:

Cách tính cỡ mẫu nghiên cứu

Trong đó:

  • n: kích thước mẫu cần xác định.
  • N: quy mô tổng thể.
  • e: sai số cho phép. Thường ba tỷ lệ sai số hay sử dụng là: ±01 (1%), ±0.05 (5%), ±0.1 (10%), trong đó mức phổ biến nhất là ±0.05.

Ví dụ: Nghiên cứu sự hài lòng của khách hàng đã mua sữa bột Ensure Gold trong tháng 8 năm 2020 tại siêu thị Coopmart Phú Thọ (Quận 11, TP.HCM). Siêu thị tổng hợp danh sách khách hàng từ hệ thống thì có 1000 khách hàng, đây là tổng thể xác định được quy mô. Như vậy cỡ mẫu tối thiểu cần có của nghiên cứu nếu sai số e = ±0.05 sẽ là 286 người:

Cách tính cỡ mẫu nghiên cứu

Xem tiếp: Phân tích hồi quy với biến giả Dummy trong SPSS

Post Views: 1,595