Các dạng sai lệch trong nghiên cứu
by Kinh Nguyen
Có nhiều dạng sai lệch tồn tại trong nghiên cứu. Sackett et al. đã liệt kê 19 loại sai lệch thường gặp trong các nghiên cứu dịch tễ học. Choi mở rộng danh sách này thành 65 dạng. Quả vậy, bất kỳ loại sai lệch nào đưa vào nghiên cứu mà có thể xác định được nguyên nhân có thể được xem là sai lệch (sai lệch hệ thống). Rất nhiều dạng là khó phát hiện và để tránh còn khó hơn. Ta sẽ xem xét ba dạng đặc biệt của sai lệch thường gặp trong các nghiên cứu y tế.
Sai lệch chọn lựa
Sai lệch chọn lựa là một sự thiếu chính xác của ước lượng ảnh hưởng do cách chọn dân số nghiên cứu. Đây có thể là dạng sai lệch thường gặp nhất trong nghiên cứu y tế, và xảy ra trong cả các nghiên cứu quan sát cũng như các nghiên cứu phân tích (kể cả các thử nghiệm).
-
Sai lệch hiện mắc-mới mắc
Loại sai lệch này có thể xuất hiện trong một nghiên cứu bệnh-chứng do kết quả của sống còn có chọn lọc của những ca hiện mắc. Trong những các ca bệnh được chọn, ta quan sát được bệnh vào giai đoạn trễ; nếu phơi nhiễm đã xảy ra nhiều năm trước đó các ca bệnh nhẹ có thể đã được cải thiện hoặc các ca nặng đã chết sẽ bị bỏ sót và không được tính vào số ca bệnh. Sai lệch này thường không phải là vấn đề trong các nghiên cứu đoàn hệ và thử nghiệm nhưng khá phổ biến trong các nghiên cứu bệnh-chứng.
Tỷ suất chết-bệnh cao trong trong giai đoạn giai đoạn sớm biểu hiện lâm sàng của bệnh mạch vành có thể làm các nghiên cứu về các yếu tố bệnh căn mất giá trị do những người có thể tham gia nghiên cứu là những người còn sống (những ca nặng không có mặt). Tương tự, nhồi máu cơ tim có thể rất thầm lặng. Các đặc điểm lâm sàng có thể không xuất hiện và những sự thay đổi hóa sinh và điện tim trong nhồi máu cơ tim có thể trở về bình thường sau một lần nhồi máu (những ca bệnh nhẹ này sẽ không xuất hiện trong các ca bệnh được nghiên cứu). Các loại sai lệch được đưa vào nghiên cứu có thể thấy rõ hơn bằng cách so sánh với một nghiên cứu đoàn hệ (khi bệnh được phát hiện trong tất các dạng) như trình bày trong Bảng [tab:bmvcholesterol].
Nghiên cứu đoàn hệ và bệnh-chứng: Ước lượng số chênh tương đối phát triển bệnh mạch vành (CHD) ở nam giới có và không có cholesterol máu cao
Cholesterol huyết thanh (r)2-4 (l)5-7 Có CHD Không CHD Tổng Có CHD Không CHD Tổng Phân vị trên 85 462 547 38 34 72 Phân vị dưới 116 1511 1627 113 117 230 Tổng 201 1973 2174 151 151 302 Tỷ số số chênh [tab:bmvcholesterol]
-
Sai lệch tỷ suất nhập viện (Sai lệch Berkson)
Loại sai lệch này là do các yếu tố có chọn lọc trong việc nhập viện và xảy ra trong các nghiên cứu trên bệnh viện. Rất nhiều nghiên cứu bệnh-chứng chọn các ca bệnh từ bệnh viện và chọn ca chứng từ những bệnh nhân trong bệnh viện nhập viện do các sự kiện không liên quan. Các cá nhân với một rối loạn khác, hoặc có biến chứng có nhiều khả năng sẽ có mặt trong một mẫu chọn từ bệnh viện so với một mẫu từ dân số chung. Các nguyên nhân sai lệch gồm gánh nặng triệu chứng, tiếp cận chăm sóc và sự nổi tiếng của một cơ quan y tế nhất định (đặc biệt là về thực tế nhập viện hiện nay). Sự khác biệt tỷ suất nhập viện sẽ biểu hiện qua sai lệch trong ước lượng nguy cơ tương đối. Loại sai lệch này phổ biến hơn trong các nghiên cứu quan sát, nhất là các nghiên cứu bệnh-chứng. Do các đối tượng được phân bổ ngẫu nhiên sau khi được chọn, loại sai lệch này ít gặp trong các thử nghiệm.
Phỏng vấn hộ gia đình được thực hiện trên một mẫu ngẫu nhiên từ dân số chung hỏi về bệnh cơ xương, bệnh hô hấp và những lần nhập viện gần đây. Trong toàn dân số, không phát hiện thấy sự kết hợp giữa hai rối loạn này (OR = 1.06), nhưng trong nhóm dân số những người đã nhập viện sáu tháng trước đó, những người có rối loạn cơ xương có nhiều khả năng bị bệnh hô hấp hơn những người không (OR = 4.06). Điều này xảy ra vì những người có cả hai rối loạn có nhiều khả năng sẽ nhập viện nhiều hơn những người chỉ có một rối loạn. Phát hiện này được minh họa trong Bảng [tab:coxuonghohap].
Bệnh về xương và cơ quan vận động với có hoặc không có bệnh đường hô hấp
(r)3-5 (l)6-8 (r)3-5 (l)6-8 Có Không Tổng Có Không Tổng Các bệnh hô hấp Có 17 207 224 5 15 20 Không 184 2376 2560 18 219 237 Tổng 201 2583 2784 23 234 257 Tỷ số số chênh [tab:coxuonghohap]
-
Sai lệch không hưởng ứng
Loại sai lệch này là do từ chối tham gia nghiên cứu. Một người như vậy sẽ có nhiều khả năng có khác biệt so với những người đồng ý tham gia. Những người không trả lời phải được so sánh với những người trả lời theo các phơi nhiễm chủ yếu và biến số kết cuộc để đảm bảo mức độ cân đối của sai lệch không trả lời.
Sai lệch không hưởng ứng là phổ biến trong tất cả các loại nghiên cứu, nhưng nghiêm trọng hơn trong các nghiên cứu quan sát. Đặc biết là các mẫu khảo sát sẽ dễ có loại sai lệch kiểu này. Nếu việc không đáp ứng là tương tự trong nhóm phơi nhiễm và nhóm không phơi nhiễm (hoặc ca bệnh và ca chứng), thì đây không phải là một vấn đề nghiêm trọng. Thông tin đầy đủ về các biến số có liên quan cần được đưa vào trong các phương tiện thu thập dữ kiện để ta có thể xác nhận ảnh hưởng của sai lệch không hưởng ứng trong kết quả. Tối đa tỷ lệ trả lời trong các khảo sát là một cách để giảm thiểu loại sai lệch này. Trong các thử nghiệm ngẫu nhiên có nhóm chứng, có thể thu thập thông tin theo chiều thời gian về các biến số có liên quan và so sánh các biến số này để có thể thấy được mức độ nghiêm trọng của vấn đề.
Trong một nghiên cứu gửi bộ câu hỏi qua bưu điện về thói quen hút thuốc lá của cựu binh Mỹ, người ta thấy rằng 85% người không hút thuốc lá gửi trả bộ câu hỏi nội trong 30 ngày, trong khi ở người hút thuốc lá tỷ lệ này chỉ là 67%. Những người hút tẩu và xì gà có tỷ suất trả lời ở mức trung gian.
Sự xác định hay sai lệch thông tin
Sai lệch thông tin là một sự thiếu chính xác của ước lượng do sai số đo lường hoặc phân loại sai đối tượng theo một hoặc nhiều biến số. Một số dạng sai lệch thông tin cụ thể được trình bày dưới đây.
-
Sai lệch chẩn đoán
Sai lệch chẩn đoán có thể xảy ra do quy trình chẩn đoán tạo ra sự không tương đồng đáng kể trong nhóm ca bệnh so với ca chứng. Trong một nghiên cứu đoàn hệ, kiến thức về phơi nhiễm trước đây với một nguyên nhân nghi ngờ của một đối tượng có thể ảnh hưởng cả mức độ và kết cuộc của quy trình chẩn đoán. Ví dụ kiến thức về việc một đối tượng đã làm việc cho ngành công nghiệp cao su có thể dẫn đến việc tìm kiếm kĩ hơn về ung thư bàng quan so với một người đã làm việc trong các ngành công nghiệp khác.
Trong một nghiên cứu bệnh-chứng, nếu một kết cuộc bệnh lý là một trong vài biểu hiện lâm sàng và đòi hỏi các xét nghiệm hoặc quy trình chẩn đoán để phát hiện, bệnh có thể bị bỏ sót trong nhóm chứng nếu họ không được khám đầy đủ trước khi đưa vào nghiên cứu. Ví dụ để xác nhận sự hiện diện của ung thư nội mạc tử cung của những người phơi nhiễm, hoặc không phơi nhiễm với với liệu pháp hóc môn, phải cùng một quy trình chẩn đoán phải được thực hiện trên cả hai nhóm với cùng tần số. Sai lệch này có thể giảm bớt khi có nhóm chứng được chọn từ những người trải qua cùng một quy trình chẩn đoán như trong nhóm bệnh và bằng cách chỉ sử dụng những ca có kết quả âm tính làm ca chứng.
Sai lệch tương tự cũng có thể xảy ra trong các nghiên cứu thử nghiệm, mặc dù hiếm hơn do sự phát triển và tuân thủ đề cương nghiên cứu có thể tránh được những dạng vấn đề này.
Tóm lại, “làm mù” những người báo cáo kết quả xét nghiệm, bằng cách giấu các thông tin lâm sàng cho biết về ca nào là chứng ca nào là bệnh (hoặc một người được gán vào nhóm điều trị nào) và cho cả ca bệnh và chứng với cùng một quy trình chẩn đoán chặt chẽ sẽ giúp giảm loại sai lệch này.
-
Sai lệch nhớ lại (hay còn gọi là sai lệch hồi tưởng)
Một sai lệch trong sự xếp nhóm có thể xảy ra nếu thông tin về biến số phơi nhiễm là không biết hoặc không chính xác. Việc xác nhận phơi nhiễm với thuốc chỉ dựa vào tiền sử, thu thập lại nhóm chứng với biến số phơi nhiễm và việc nhà nghiên cứu hỏi về biến số phơi nhiễm kỹ hơn trong nhóm bệnh có thể dẫn đến sai lệch dạng này. Việc nhớ lại ở ca bệnh và ca chứng có thể khác nhau cả về lượng và độ chính xác. Các ca bệnh có nhiều khả năng nhớ lại phơi nhiễm nhất là khi được tiếp cận qua truyền thông về các nguyên nhân tiềm ẩn của bệnh trong thời gian gần đây.
Khi hỏi các bà mẹ mang thai gần đây mà bị chết thai hoặc dị tật (các ca bệnh), và một nhóm bắt cặp gồm các bà mẹ mang thai có thai kỳ diễn tiến bình thường (chứng), kết quả cho thấy có đến 28% trong nhóm bệnh nhưng chỉ có 20% trong nhóm chứng báo cáo có phơi nhiễm với thuốc. Điều này không thể chứng minh được trong các cuộc phỏng vấn trước đó hoặc được ghi chép trong hồ sơ sức khỏe.
Sai lệch dạng này có thể tránh được khi tuân thủ chặt chẽ theo đề cương đã phát triển, quản lý theo một theo cách chuẩn bằng cách “làm mù” người nghiên cứu và qua sử dụng các dữ kiện hồ sơ để bổ sung thông tin thu thập từ phỏng vấn và ghi nhận.