Các phương pháp chọn mẫu
by Kinh Nguyen
Một khi đã xác định được dân số và cỡ mẫu, ta cần quyết định xem cần chọn mẫu ra từ dân số như thế nào. [Cỡ mẫu cũng phụ thuộc vào lựa chọn này và do đó vấn đề cỡ mẫu ở trên cần được xem lại sau khi đã chọn được phương pháp chọn mẫu; hầu hết những nội dung trình bày trong các phần trước về cỡ mẫu đều giả định chọn mẫu ngẫu nhiên đơn.]
-
Chọn mẫu ngẫu nhiên đơn
Đây là phương pháp chọn mẫu phổ biến và đơn giản nhất. Trong phương pháp này, đối tượng được chọn từ dân số với xác suất được chọn như nhau. Có thể sử dụng các bảng số ngẫu nhiên hoặc dùng các kỹ thuật như bỏ tên của đối tượng vào nón và chọn đối tượng một cách ngẫu nhiên đến khi đủ mẫu. Các chương trình máy tính đã có sẵn để chọn ra một mẫu ngẫu nhiên từ dân số. Ưu thế của phương pháp này là nó dễ thực hiện, về lâu dài sẽ đại diện cho dân số và việc phân tích những dữ kiện thu thập bằng phương pháp này là dễ dàng. Hạn chế là mẫu được chọn có thể không thực sự đại diện cho dân số, nhất là khi cỡ mẫu nhỏ.
-
Chọn mẫu phân tầng
Khi cỡ mẫu là nhỏ và ta có một số thông tin về về phân phối của một biến số nhất định (v.d. giới: 50% nam/50% nữ), việc chọn mẫu ngẫu nhiên đơn từ các nhóm dân số xác định bởi biến số này có thể có ưu điểm. Bằng cách chọn một nửa mẫu từ đàn ông và một nửa từ phụ nữ ta có thể đảm bảo là cỡ mẫu đại diện cho dân số về mặt giới tính. Khi yếu tố gây nhiễu là một vấn đề quan trọng (như trong các nghiên cứu bệnh-chứng), chọn mẫu phân tầng sẽ giảm các gây nhiễu tiềm tàng do chọn những nhóm dân số đồng nhất.
-
Chọn mẫu cụm
Trong các khảo sát hành chính, nghiên cứu được thực hiện trên một dân số lớn có thể phân tán nhiều về mặt địa lý. Để lấy được đủ số đối tượng cho nghiên cứu bằng phương pháp chọn mẫu ngẫu nhiên đơn sẽ đòi hỏi chi phí lớn và sẽ không thuận tiện. Trong những trường hợp như vậy, các cụm được xác định (v.d. hộ gia đình) và một mẫu ngẫu nhiên các cụm sẽ được đưa vào nghiên cứu; sau đó mọi thành viên của cụm cũng sẽ được đưa vào nghiên cứu. Việc này đưa vào hai dạng biến thiên trong dữ kiện - giữa các cụm và nội trong các cụm - và điều này cần được tính toán đến khi phân tích dữ kiện.
-
Chọn mẫu nhiều giai đoạn
Trong nhiều nghiên cứu, đặc biệt là các khảo sát trên diện quốc gia, sẽ dùng các phương pháp chọn mẫu khác nhau cho những nhóm khác nhau và có thể được được thực hiện trong nhiều giai đoạn. Phương pháp này ít được sử dụng trong các thử nghiệm, hoặc các nghiên cứu dịch tễ học phổ biến như nghiên cứu bệnh-chứng hay đoàn hệ. Xem chi tiết các phương pháp này trong tài liệu Levy Lemeshow.