Phân loại phương pháp chọn điểm nghiên cứu là gì

Đối với phương pháp lấy mẫu phi xác suất, đơn vị lấy mẫu (phần tử) được chọn không ngẫu nhiên. Nhà nghiên cứu không biết xác suất xuất hiện của các phần tử. Phương pháp được thực hiện một cách thuận tiện, chủ quan nên phụ thuộc rất nhiều vào ý kiến chủ quan của nhà nghiên cứu. Không thể dùng tham số mẫu để ước lượng hoặc kiểm định tham số tổng thể.

Các phương pháp lấy mẫu thuộc nhóm phi xác suất bao gồm: (1) Mẫu thuận tiện, (2) Mẫu phán đoán, (3) Mẫu theo lớp và (4) Mẫu theo mầm (Bảng 1).

1.1. Mẫu thuận tiện (Convenience Sampling)

Phương pháp lấy mẫu thuận tiện dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện”; nghĩa là người thực hiện nghiên cứu chọn những phần tử có thể tiếp cận được để lấy mẫu. Nhược điểm của biện pháp này là không xác định được sai số lấy mẫu và không thể kết luận cho tổng thể từ kết quả lấy mẫu. Lấy mẫu thuận tiện được sử dụng phổ biến, khi bị giới hạn về thời gian và chi phí thực hiện nghiên cứu.

Ví dụ: Cần lấy mẫu với kích thước n = 200, thị trường Tp.HCM, độ tuổi từ 18 đến 22 về cảm nhận đối với một sản phẩm mới. Người tiến hành lấy mẫu thuận tiện (sinh viên) sẽ phỏng vấn 200 người bạn học cùng Khoa chấp nhận tham gia phỏng vấn.

1.2. Mẫu phán đoán (Judment Sampling)

Phương pháp lấy mẫu phán đoán buộc nhà nghiên cứu tự phán đoán sự thích hợp của các phần tử để mời họ tham gia vào mẫu. Như vậy, tính đại diện của mẫu phụ thuộc vào kiến thức và kinh nghiệm của nhà nghiên cứu.

Ví dụ: Cần lấy mẫu với kích thước n = 200, thị trường Tp.HCM, độ tuổi từ 18 đến 22 về cảm nhận đối với một sản phẩm mới. Áp dụng lấy mẫu phán đoán bằng cách xác định phần tử đại diện dựa vào phán đoán của phỏng vấn viên. Nếu khả năng/kinh nghiệm phán đoán tốt thì cho mẫu tốt hơn thuận tiện.

1.3. Mẫu theo lớp (Quota Sampling)

Phương pháp lấy mẫu theo lớp áp dụng cho tổng thể đã được phân tổ, nhà nghiên cứu cần chọn đủ số lượng mẫu để đảm bảo tỷ lệ mẫu và các đặc trưng kiểm soát mà không cần ngẫu nhiên. Có thể sử dụng một hoặc nhiều thuộc tính kiểm soát như độ tuổi, giới tính, thu nhập, loại hình doanh nghiệp… Đây là phương pháp lấy mẫu phi xác suất được sử dụng phổ biến nhất trong thực tiễn nghiên cứu.

Ví dụ: Lấy mẫu theo lớp theo độ tuổi, kích thước tổng thể N = 10.000, tỷ lệ mẫu đạt 1%.

Do kích thước tổng thể N = 10.000, tỷ lệ mẫu yêu cầu 1% nên tính được kích thước mẫu n = 100. Như được trình bày ở Bảng 2, tổng thể có 30% người tiêu dùng ở độ tuổi từ 20 đến 30 nên lấy mẫu theo lớp sẽ chọn 30 người có độ tuổi từ 20 đến 30.

Bảng 2. Lấy mẫu theo lớp theo độ tuổi

Độ tuổi

Tổng thể N = 10.000

20-30 (30%)

31-40 (40%)

41-50 (30%)

Mẫu n = 100

30

40

30

[Nguồn: nghiencuukhoahoc.edu.vn, 2017]

1.4. Mẫu theo mầm (Snow Ball Sampling)

Phương pháp lấy mẫu theo mầm yêu cầu nhà nghiên cứu chọn ngẫu nhiên một số phần tử ban đầu. Sau đó, thông qua các phần tử ban đầu này để xác định các phần tử còn lại của mẫu. Phương pháp này thích hợp khi tổng thể ít phần tử hoặc khó nhận ra đối tượng cần để thu thập dữ liệu.

Ví dụ: Nghiên cứu thị trường dụng cụ chơi golf tại Tp.HCM và đối tượng để thu nhập thông tin là người chơi golf. Có thể chọn một vài người chơi golf (chọn mầm) và thông qua những người này để tìm những phần tử khác để lấy mẫu (phát triển mầm).

Phương pháp lấy mẫu phi xác suất chưa chắc đã tiết kiệm chi phí, nhưng thường tồn tại nhiễu và không xác định được độ tin cậy của dữ liệu thu thập.

2. Phương pháp lấy mẫu xác suất (ngẫu nhiên)

Có nhiều phương pháp lấy mẫu ngẫu nhiên. Những cách thường dùng bao gồm: (1) Ngẫu nhiên đơn giản, (2) Hệ thống, (3) Phân tầng và (4) Theo nhóm.

Đặc tính của lấy mẫu ngẫu nhiên:

- Kiểm soát được sai số của việc lấy mẫu.

- Kiểm định, suy luận tổng thể từ mẫu.

2.1. Ngẫu nhiên đơn giản (Simple Random Sampling)

Phương pháp lấy mẫu ngẫu nhiên đơn giản lấy mẫu dựa trên việc đã biết phân bố của tổng thể. Phần tử được chọn vào tập mẫu có xác suất như nhau và biết trước. Công cụ áp dụng như rút thăm, thẻ ngẫu nhiên hoặc hàm Rand() trong phần mềm Microsoft Excel.

Phương pháp này có ưu điểm là đơn giản, dễ thực hiện nếu đã có một khung chọn mẫu hoàn chỉnh. Tuy nhiên, mức phân bố mẫu trên thị trường có thể bị vi phạm nếu tổng thể có kích thước lớn và kích thước mẫu nhỏ.

Vì nhược điểm nêu trên, phương pháp lấy mẫu ngẫu nhiên không khả thi khi tổng thể có kích thước lớn. Người ta thường sử dụng nó để chọn phần tử cho các phương pháp lấy mẫu khác như chọn điểm xuất phát cho phương pháp lấy mẫu hệ thống.

2.2. Lấy mẫu hệ thống (Systematic Sampling)

Phương pháp lấy mẫu hệ thống được thực hiện bằng cách chọn ngẫu nhiên điểm xuất phát. Từ điểm xuất phát này và dựa vào bước nhảy để chọn các phần tử tiếp theo cho mẫu từ khung chọn mẫu được sắp xếp theo thứ tự từ 1 đến N.

Ví dụ: Lấy mẫu có kích thước n = 200 từ tổng thể N = 2000. Như vậy bước nhảy = N/n = 2000/200 = 10. Để chọn phần tử đầu tiên trong 10 phần tử đầu tiên trong khung mẫu, sử dụng phương pháp lấy mẫu ngẫu nhiên đơn giản. Giả sử, chọn được phần tử thứ 6. Phần tử thứ hai tham gia vào mẫu là phần tử thứ 16 trong khung chọn mẫu (6 + 10), và phần tử thứ ba là 26 (16 +10). Như vậy, phần tử nào ở vị trí có số ở hàng đơn vị là 6 sẽ được chọn mẫu. Phần tử cuối cùng trong danh sách sẽ ở vị trí 1996.

Lấy mẫu hệ thống giúp khắc phục được nhược điểm phân bố không đều của phương pháp ngẫu nhiên đơn giản. Tuy nhiên, nhược điểm là nếu khung lấy mẫu được xếp theo chu kỳ và tần số trùng với bước nhảy thì mẫu sẽ bị chệch.

2.3. Phân tầng (Startified Sampling)

Người ta chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức nào đó gọi là tiêu thức phân tổ (thu nhập, giới tính, tuổi tác, trình độ học vấn, nhân khẩu...). Lấy mẫu ngẫu nhiên đơn giản cho từng tổ với kích thước mẫu tỉ lệ với độ lớn của tổ (phương pháp lấy mẫu hệ thống). Tổng hợp hai phương thức này là lấy mẫu phân tầng,

Ví dụ: Lấy mẫu với kích thước n = 200 từ tổng thể N = 2.000. Tổng thể được chia thành 4 nhóm theo độ tuổi với kích thước của từng nhóm và số lượng phần tử tham gia vào mẫu (Bảng 3).

Bảng 3. Lấy mẫu phân tầng theo tổ dữ liệu

Phân tổ theo độ tuổi

Tổng thể

N = 2.000

18-30

31-40

41-50

trên 51

500

500

600

400

Mẫu n = 200

50

50

60

40

[Nguồn: nghiencuukhoahoc.edu.vn, 2017]

Phương pháp lấy mẫu phân tầng được sử dụng phổ biến vì tính chính xác và đại diện cao. Ngoài ra, tiêu chí phân tổ (phù hợp) ảnh hưởng đến độ chính xác của mẫu.

2.4. Phân vùng (Cluster Sampling)

Trong các phương pháp lấy mẫu ngẫu nhiên đã trình bày, phần tử mẫu được chọn trực tiếp từ khung chọn mẫu. Với phương pháp ngẫu nhiên đơn giản và hệ thống thì phần tử mẫu được chọn trực tiếp từ tổng thể; còn với phương pháp lấy mẫu phân tầng thì phần tử mẫu được chọn từ từng tổ.

Lấy mẫu phân vùng, nhà nghiên cứu chia tổng thể ra thành nhiều phân vùng (cluster) như phương pháp phân tầng. Tuy nhiên, các phân vùng này có đặc điểm là các phần tử trong cùng một phân vùng có tính dị biệt cao. Vậy nên có thể lại tiếp tục chia từng phân vùng thành nhiều nhóm nhỏ nữa. Sau đó có thể sử dụng phương pháp ngẫu nhiên đơn giản hay hệ thống để lấy mẫu từ một số nhóm của một số phân vùng.

- Có thể phân nhóm nhiều bước, tiếp tục chọn nhóm con trong nhóm.

- Phân chia tổng thể thành nhiều phân vùng dựa trên địa giới, dữ liệu thuộc phân vùng thường cùng khu vực hay lân cận nhau.

- Chọn mẫu theo khu vực (area sampling) là một dạng của lấy mẫu phân tầng với các tầng (nhóm) được phân chia theo khu vực địa lý.

Ví dụ: Lấy mẫu có kích thước n = 8 từ tổng thể N = 95 bằng phương pháp lấy mẫu phân vùng. Tiến hành chia tổng thể thành 5 phân vùng và chọn ngẫu nhiên 2 phân vùng. Sau đó, dùng phương pháp hệ thống để chọn 8 phần tử cho mẫu từ 2 phân vùng trên, hay 4 phần tử mỗi vùng.

Phân vùng hai cấp

Quận Y có 200 khu phố (b), mỗi khu phố có 20 hộ gia đình (h) nên quận Y có N = 200 × 20 = 4.000 hộ gia đình (tổng thể). Kích thước mẫu n = m × k = 100 hộ gia đình thì tỷ lệ chọn mẫu sẽ là n/N= 1/40. Với m là số khu phố cấp 1, k là số hộ gia đình cấp 2.

Chọn mẫu ngẫu nhiên theo vùng 2 cấp:

- Cấp khu phố: Với tỷ lệ chọn 1/b;

- Cấp hộ gia đình: Với tỷ lệ chọn 1/h.

Vậy theo yêu cầu thì tỷ lệ chọn toàn thể là (1/b) × (1/h) = 1/(b×h) = 1/40; m × k = 100. Dựa trên tỷ lệ chọn toàn thể đề xuất 6 phương án lấy mẫu (Bảng 4).

Bảng 4. Phương pháp lấy mẫu phân vùng hai cấp

Phương án

Tỷ lệ cấp 1 (1/b)

Tỷ lệ cấp 2 (1/h)

Tỷ lệ toàn thể (1/b×h)

Số khu phố cấp 1 (m)

Số hộ gia đình cấp 2 (k)

1

1/2

1/20

1/40

100

1

2

1/4

1/10

1/40

50

2

3

1/8

1/5

1/40

25

4

4

1/10

1/4

1/40

20

5

5

1/20

1/2

1/40

10

10

6

1/40

1

1/40

5

20

[Nguồn: nghiencuukhoahoc.edu.vn, 2017]

Lấy mẫu xác suất kiểm soát được sai số mẫu.

So sánh giữa phương pháp lấy mẫu xác suất và phi xác suất ở Bảng 5.

Bảng 5. So sánh phương pháp lấy mẫu xác suất và phi xác suất

Xác suất

Phi xác suất

Ưu điểm

Tính đại diện cao; khái quát hóa cho tổng thể.

Tiết kiệm thời gian và chi phí.

Nhược điểm

Tốn thời gian và chi phí.

Tính đại diện thấp.

Phạm vi sử dụng

Cho nghiên cứu mô tả.

Nghiên cứu thăm dò.

[Nguồn: nghiencuukhoahoc.edu.vn, 2017]

Kết thúc.


Trên đây là những phần nội dung chính bạn cần quan tâm nếu muốn lựa chọn phương pháp lấy mẫu. Thế nhưng, xác định được lý do lấy mẫu sẽ là cơ sở để lựa chọn một phương pháp phù hợp, bạn còn phải quan tâm đến loại dữ liệu sử dụng (thứ cấp hay sơ cấp), kỹ thuật thu thập thông tin bằng phỏng vấn, bảng hỏi, tài liệu hay quan sát… Bạn sẽ tìm thấy đáp án cho tất cả câu hỏi này ở Chương 2 cuốn sách NGHIÊN CỨU KHOA HỌC TRONG KINH TẾ - XÃ HỘI & Hướng dẫn viết luận văn/luận án 2023. Tham khảo nội dung sách sau đây.