Phương pháp chọn mẫu Địa điểm - thời gian (TLS-Time Location Sampling)
October 20, 2012 by Kinh Nguyen
Các dân số có nguy cơ cao (the most at risk populations -MARPs) mắc HIV/AIDS thường ẩn và thuộc về các phân nhóm khó tiếp cận trong hầu hết các nước trên thế giới. Hơn nữa, ta không thể áp dụng các phương pháp chọn mẫu thuận tiện để chọn được một mẫu có tính đại diện cho nghiên cứu. Do vậy, hiện nay có rất nhiều các phương pháp chọn mẫu thay thế được thiết kế để khắc phục vấn đề này. Chọn mẫu địa điểm - thời gian (TLS) là một trong các phương pháp này.
Một số thuật ngữ sử dụng trong bài
Cơ sở (Venue): Vị trí nơi mà dân số mục tiêu thường tập trung theo ngày và khoảng thời gian cụ thể.
Đơn vị ngày-giờ (VDT: Venue-Day-Time): khoảng thời gian khoảng 4 tiếng mà một cơ sở hoạt động trong ngày, tuần hoặc tháng. Tất cả các cơ sở được chọn trong khung mẫu phải có ít nhất một đơn vị ngày-giờ mỗi tháng.
Khung mẫu: danh sách các cơ sở có ít nhất 1 VDT, nơi được mong đợi sẽ cung cấp được 8 đối tượng thỏa tiêu chí chọn trong 1 VDT.
Đánh giá ban đầu (formative assessment): nghiên cứu định tính được tiến hành trước khi khảo sát, gồm có thảo luận nhóm, phỏng vấn sâu, lập bản đồ hoặc quan sát dân số mục tiêu hay các đối tượng có liên quan đến dân số mục tiêu.
Phần thưởng (Incentive): là phần quà cho đối tượng tham gia trong nghiên cứu TLS.
Liệt kê (Enumeration): Liệt kê là một quá trình đếm số người xuất hiện, những người mà phù hợp với tiêu chí chọn trong dân số mục tiêu và những người đến các cơ sở chọn mẫu trong lúc liệt kê hoặc chọn mẫu.
Thẻ hẹn (Appointment card): sau khi một đối tượng được chọn vào nghiên cứu, khi họ hoàn tất bộ câu hỏi và được thu thập mẫu máu,v.v., mỗi người sẽ được phát một thẻ hẹn tham vấn. Người này có thể tùy ý chọn một nơi để nhận kết quả xét nghiệm máu hoặc các dịch vụ khác.
Điều phối viên cơ sở (Field coordinator): đóng vai trò là quản lý cơ sở chịu trách nhiệm chọn ra phương pháp liệt kê thích hợp nhất, sắp đặt các nghiên cứu viên vào những vị trí thích hợp, đếm tất cả các đối tượng phù hợp tiêu chí và giám sát sự an toàn cho nghiên cứu viên trong suốt thời gian cơ sở làm việc.
Hiệu chỉnh: Xác suất một cá nhân được chọn trong nghiên cứu có thể thay đổi tùy theo mỗi cơ sở. Điều này tùy thuộc vào cỡ của cơ sở và số người tham gia vào nghiên cứu trong cơ sở đó. Do vậy, hiệu chỉnh trong TLS thể hiện xác suất chọn của mỗi người được tính bằng cách chia xác suất được liệt kê cho xác suất được phỏng vấn tại mỗi cơ sở.
Như đã đề cập đến trong các bài viết về phương pháp chọn mẫu Dây chuyền có kiểm soát (Responding Driven Sampling -RDS), các dân số có nguy cơ cao (the most at risk populations -MARPs) mắc HIV/AIDS thường ẩn và thuộc về các phân nhóm khó tiếp cận trong hầu hết các nước trên thế giới. Hơn nữa, ta không thể áp dụng các phương pháp chọn mẫu thuận tiện để chọn được một mẫu có tính đại diện cho nghiên cứu. Do vậy, hiện nay có rất nhiều các phương pháp chọn mẫu thay thế được thiết kế để khắc phục vấn đề này. Chọn mẫu địa điểm - thời gian (TLS) là một trong các phương pháp này.
Lịch sử và Phương pháp luận
TLS được sử dụng đầu tiên trong giám sát hành vi của những người nam có quan hệ tình dục với nam (MSM) ở Mỹ vào những năm 1990. Phương pháp luận là nếu ta có thể tiếp cận nơi mà các thành viên của dân số mục tiêu thường tập trung đều đặn trong những ngày, giờ cụ thể, thì ta có thể tiếp cận với hầu hết các đối tượng trong mẫu nghiên cứu. Ta gọi những nơi này là “cơ sở” (venues). Những cơ sở này được phân biệt theo địa điểm và theo thời gian.
Nhìn rộng hơn, TLS là một phương pháp điều chỉnh tử phương pháp chọn mẫu cụm. Trong chọn mẫu cụm ta phân loại một dân số ra theo các cụm như các trường học, xã, làng, v.v. và chọn ngẫu nhiên ra một số cụm để chọn các đối tượng nghiên cứu. Phương pháp chọn mẫu cụm đã tối ưu hóa năng lực nghiên cứu khi giảm thiểu sự khác nhau giữa các cụm và tăng tối đa sự khác biệt trong 1 cụm. Nói cách khác, ta hi vọng rằng các đặc điểm của các đối tượng trong cụm được chọn ít khác biệt so với những đối tượng trong các cụm khác.
Trong TLS, ta xác định các cụm dựa trên các cơ sở. Ví dụ, một câu lạc bộ thì không phải là một cụm đồng nhất; theo những đặc điểm của những người tham dự hoạt động tại các cơ sở này thay đổi theo những thời gian khác nhau trong những ngày khác nhau, ta có thể xem mỗi cơ sở này tương tự như nhiều cụm khác nhau. Khi đó, mỗi cụm sẽ được tính cho đến tối đa là 14 cụm nếu đặc điểm của người tham dự vào buổi sớm và khuya là khác biệt nhau trong cả 7 ngày trong tuần.
Nói chung, nếu ta chọn được đủ địa điểm và thời gian, ta có thể mong đợi chọn được một cỡ mẫu có thể đại diện cho dân số mục tiêu.
TLS được sử dụng đầu tiên trong giám sát hành vi của những người nam có quan hệ tình dục với nam (MSM) ở Mỹ vào những năm 1990. Phương pháp luận là nếu ta có thể tiếp cận nơi mà các thành viên của dân số mục tiêu thường tập trung đều đặn trong những ngày, giờ cụ thể, thì ta có thể tiếp cận với hầu hết các đối tượng trong mẫu nghiên cứu. Ta gọi những nơi này là “cơ sở” (venues). Những cơ sở này được phân biệt theo địa điểm và theo thời gian.
Khung mẫu
Tương tự như các phương pháp chọn mẫu xác suất khác, ta phải có một khung mẫu, tức là một danh sách của các cụm. Để có một khung mẫu cho TLS, ta cần một bản đồ của tất cả các địa điểm mà MARPs có thể đến cũng như những ngày và thời gian mà họ tập trung lại với nhau, cái mà ta còn gọi là “Hệ thống cơ sở” (Universe of Venues). Giống như chọn mẫu cụm, trong TLS, ta sẽ chọn ngẫu nhiên một số cơ sở từ hệ thống cơ sở này.
Thu thập dữ kiện
Trong quá trình thu thập dữ kiện tại các cơ sở, một điều phối viên cơ sở liệt kê tất cả các cá nhân thỏa tiêu chí (thuộc dân số mục tiêu) đi vào đi vào khu vực liệt kê hoặc băng qua ranh giới liệt kê (Hình 1). Một số những người này sẽ được tiếp cận và phỏng vấn nếu họ thỏa tiêu chí chọn.
Hình 1- Hai loại khu vực liệt kê, ta có thể chọn 1 trong 2 tùy vào lưu lượng và hướng di chuyển của người trong cơ sở
Những việc cần làm
Để tìm ra MARPs tập trung vào lúc nào và ở đâu, ta cần tiến hành các hoạt động tiền nghiên cứu, hầu hết là các đánh giá ban đầu. Đó là việc hồi cứu y văn, phát hiện các bên liên quan trong cộng đồng, phỏng vấn những người cung cấp thông tin chính, các cuộc thảo luận nhóm với những người trong dân số mục tiêu. Một khi danh sách ban đầu của các cơ sở được nhận diện thông qua các đánh giá ban đầu, những phương pháp liệt kê khác nhau sẽ được tiến hành để xác định những ngày và thời gian mà có nhiều đối tượng nghiên cứu tham dự, một ước lượng cỡ dân số của MARPs sẽ được tiến hành trong thời gian này và xác định phương pháp liệt kê thích hợp nhất là đường liệt kê hay vùng liệt kê.
Vì mô hình của mỗi dân số mục tiêu có thể thay đổi, ta cần phải cập nhật hệ thống cơ sở một cách định kỳ, chẳng hạn như hàng tháng, ngay cả trong giai đoạn thu thập dữ kiện. Ví dụ, qua đó ta có thể loại trừ ngay những cơ sở mà sẽ không hoạt động trong những tháng tiếp theo. Nói tóm lại, nhiệm vụ chính trong kế hoạch hoạt động trong những tháng sắp đến có thể làm như sau:
- Thiết lập/cập nhật hệ thống cơ sở
- Gạch bỏ những ngày mà nhân viên được nghỉ
- Đánh dấu những sự kiện, ngày lễ trong những tháng sắp tới
- Chọn ngẫu nhiên không hoàn lại 14-16 cơ sở từ danh sách cập nhật
- Hoàn tất kế hoạch làm việc theo từng tuần và tiếp tục đến khi toàn bộ các cơ sở được lên kế hoạch.
- Với mỗi cơ sở được lên lịch, chọn ngẫu nhiên 2 cơ sở dự phòng để nhân viên có thể điều tiết thời gian hiệu quả nếu cơ sở chính bị đóng vì lí do không lường trước được.
Cuối cùng, ta sẽ có 1 kế hoạch hoạt động được sử dụng như một hướng dẫn lấy mẫu/lịch lấy mẫu trong những tháng tiếp theo của các điều tra viên. Bảng 1 thể hiện 1 ví dụ về một lịch làm việc 2 ngày.
Chọn mẫu
Trong suốt quá trình thu thập dữ kiện, ta nên ghi nhận lại tất cả số đối tượng thỏa tiêu chí có đến cơ sở. và cùng cần chú ý là việc liệt kê sẽ đếm bất cứ đối tượng thỏa tiêu chí chọn nào có đến vùng liệt kê trong quá trình chọn mẫu. Thường thì một quá trình chọn mẫu ngẫu nhiên hệ thống sẽ được áp dụng để chọn các đối tượng này, điều tra viên sẽ đặt các câu hỏi về hành vi trong một khu vực riêng biệt và sau đó thu thập các mẫu xét nghiệm, cũng cần phải có một đội cơ động để thu thập các mẫu xét nghiệm sinh học nếu cần.
Khi các nghiên cứu viên nghiên cứu tại cơ sở, điều phối viên cơ sở sẽ thông báo với các nhân viên tại cơ sở rằng họ sẽ tiến hành cuộc khảo sát. Điều phối viên sẽ bắt đầu liệt kê sau khi hướng dẫn các nghiên cứu viên đến các khu vực thích hợp tại cơ sở. Quá trình đếm và liệt kê này sẽ được sử dụng sau này như một xác suất hiệu chỉnh trong quá trình phân tích. Một phần quà và một thẻ hẹn sẽ được phát cho đối tượng nghiên cứu sau khi thu thập đủ dữ kiện. Tất cả các đối tượng tham gia đều được mời đến một buổi tham vấn vào những ngày sau đó để họ có thể nhận kết quả các xét nghiệm và các dịch vụ tham vấn sâu hơn.
Phân tích
Như đã nhắc đến ở trên, TLS là phương pháp chọn mẫu cụm hiệu chỉnh. Do vậy, ta cũng phải phân tích dữ kiện như trong chọn mẫu cụm. Dữ kiện của các đối tượng từ các cơ sở có lưu lượng người cao thì có vai trò quan trọng hơn vì dữ kiện này đại diện cho một tỷ lệ lớn hơn trong dân số mục tiêu. Do vậy, ta cần hiệu chỉnh lại dữ kiện, tùy theo cỡ của mỗi cơ sở bằng cách đếm tất cả các đối tượng thỏa tiêu chí chọn đi vào khu vực liệt kê hoặc đi qua đường liệt kê. Hơn nữa, ta nên xem xét tính phân cụm của dữ kiện. Nói cách khác, ta không thể giả định rằng các đối tượng trong cơ sở là hoàn toàn độc lập với nhau. Do đó việc phân tích nên sử dụng phương pháp phân tích hiệu chỉnh theo cỡ cụm (survey analysis) để có thể xem xét tính phân cụm của dữ kiện và có những hiệu chỉnh phù hợp trong phân tích. Các phần mềm thống kê chuyên biệt như STATA hay SAS là cần thiết để chạy các phân tích nâng cao như trong trường hợp này.
Những điểm cần lưu ý
Thứ nhất, TLS không phải là lựa chọn tốt nhất để nghiên cứu MARPs nhất là trong trường hợp mà nhóm dân số ẩn không tập trung tại một khu vực cụ thể nào đó hoặc những người đến các cơ sở là khác biệt với những người cùng nhóm nhưng không tập trung tại các cơ sở.
Thứ hai, vì TLS đòi hỏi những nhóm đặc biệt để tiến hành các công việc tại các cơ sở thực địa, do đó, an toàn luôn luôn là một mối quan tâm hàng đầu; trong trường hợp khẩn cấp điều tra viên cần từ bỏ việc tuyển đối tượng nghiên cứu và rời cơ sở ngay lập tức. Khi không thể đảm bảo sự an toàn tại cơ sở, các phương pháp lấy mẫu khác, chẳng hạn RDS, có thể là phương pháp thích hợp nhất.
Cuối cùng, bất cứ địa điểm nào dù công cộng hay riêng tư nơi mà có dân số ta quan tâm lui tới tham dự ta đều cần phải đưa vào hệ thống cơ sở, trừ những cơ sở có cung ứng các dịch vụ y tế, xã hội hoặc bất cứ dịch vụ phòng hay chữa bệnh nào. Điều này có thể làm giảm số cơ sở được liệt kê và có thể có khó khăn trong việc tìm đủ các cơ sở thỏa tiêu chí chọn trong khung mẫu.
Các vấn đề và trở ngại trong thực hiện
Mặc dù khái niệm về TLS trình bày ở trên khá đơn giản, nhưng thực ra có rất nhiều điều phức tạp trong việc quản lí và vận hành quá trình lấy mẫu này. Có thể kể đến những điểm chính như sau:
- Làm thế nào để tìm ra danh sách các cơ sở?
- Làm thế nào để chắc chắn về thời gian (ngày, giờ) làm việc của các cơ sở này?
- Với kết quả nghiên cứu, liệu người ta có thay đổi hành vi?
- Phương pháp liệt kê nào là thích hợp nhất?
- Trong những người đến cơ sở, ai nên được chọn vào nghiên cứu?
- Làm thế nào để phân biệt các trường hợp trùng lặp với các trường hợp mới?
- Làm thế nào để đảm bảo an toàn cho các điều tra viên tại cơ sở?
Kết luận
TLS chọn ngẫu nhiên các đối tượng nghiên cứu từ những vị trí cụ thể trong một khoảng thời gian cụ thể . Phương pháp này sẽ được xem là một phương pháp chọn mẫu ngẫu nhiên, nếu khung mẫu bao gồm hầu hết các cơ sở và cỡ của dân số mục tiêu đến các cơ sở trong khung mẫu là đủ và đều được ghi nhận chính xác. Do vậy, ta mong đợi rằng cơ hội mỗi cá nhân trong dân số mục tiêu được chọn trong các cơ sở là khác không.
Tài liệu đọc thêm:
1. H. Fisher Raymond, Theresa Ick, Michael Grasso, Jason Vaudrey, Willi McFarland, (2007). Resource Guide: Time Location Sampling (TLS), San Francisco Department of Public Health, HIV Epidemiology Section, Behavioral Surveillance Unit
2. Magnani, R., Sabin, K., Saidel, T., Heckathorn, D. (2005). Review of sampling hard-to reach populations for HIV surveillance. AIDS. 19 Suppl 2, S67-S72.
3. Muhib, F.B., Lin, L.S., Stueve, A., Miller, R.L., Ford, W.L., Johnson, W.D., Smith, P.J., Community Intervention Trial for Youth Study Team. (2001). A venue-based method for sampling hard-to-reach populations. Public Health Reports. 116(Supp. 1) 216-222.