Sử dụng xác suất để đánh giá nguy cơ trong các nghiên cứu dịch tễ học

by Kinh Nguyen

Mới mắc và hiện mắc

Số đo nguy cơ cơ bản là xác suất bệnh (hay bất kỳ kết cuộc quan tâm nào). Hai số đo thường được sử dụng là số hiện mắc và số mới mắc. Số hiện mắc đo lường xác suất có bệnh, trong khi số mới mắc đo lường xác suất mắc một bệnh. Những số đo này có thể được biểu diễn chính thức là

Hiện mắc thời điểm = số người có bệnh (kết cuộc) trong một dân số tại một điểm thời gian cụ thể / tổng dân số nguy cơ tại thời điểm đó

Hiện mắc thời khoảng = số người có bệnh trong một dân số trong một thời khoảng nhất định / tổng dân số nguy cơ trong thời khoảng đó.

Trong cả hai trường hợp trên, tử số là số ca hiện có bệnh. Đây là số đo tính được trong các nghiên cứu cắt ngang.

Mặt khác, tử số trong số mới mắc là số ca mới mắc bệnh. Như đã thấy ở trước, có hai cách để đo lường mới mắc, tùy vào mẫu số nào được sử dụng: số mới mắc tích lũy và mật độ mới mắc. Cả hai số đo cho ước lượng về xác suất mắc bệnh, nhưng đơn vị đo lường là khác nhau trong hai phương pháp. Số mới mắc tích lũy ước lượng xác suất mắc bệnh theo người và mật độ mới mắc là ước lượng xác suất mắc bệnh theo người-thời gian.

Các số đo sự kết hợp

Các số đo sự kết hợp của một phơi nhiễm với một kết cuộc luôn liên quan tới các xác suất của nhiều sự kiện. Thực tế sử dụng số đo nào sẽ tùy thuộc vào chiến lược thiết kế. Xác suất chỉ có thể tính toán được khi xác định được “dân số nguy cơ”.

Nghiên cứu đoàn hệ

Khi so sánh xác suất mắc bệnh trong hai nhóm như trong trường hợp một nghiên cứu đoàn hệ, khi so sánh xác suất mắc bệnh giữa nhóm phơi nhiễm với xác suất mắc bệnh trong nhóm không phơi nhiễm, một số đo tương đối được sử dụng . Tỷ số của hai xác suất được gọi là nguy cơ tương đối (RR). R__R = số mới mắc trong nhóm phơi nhiễm / số mới mắc trong nhóm không phơi nhiễm Có thể sử dụng cả hai số đo mới mắc trong tính toán. Ví dụ, giả sử một nghiên cứu đoàn hệ gồm 400 người hút thuốc lá và 600 người không hút thuốc lá ghi nhận số mới mắc tăng huyết áp trong 10 năm. Bảng [tab:chap7htltha] sau tóm tắt dữ kiện vào lúc kết thúc nghiên cứu.

Mối liên quan giữa hút thuốc lá và tăng huyết áp - nghiên cứu đoàn hệ

         
    Không Tổng
Hút thuốc lá 120 280 400
  Không 30 570 600
  Tổng * * 1000

[tab:chap7htltha]

Xác suất tăng huyết áp của người hút thuốc lá, P(H S), cũng được ký hiệu là Ie (mới mắc trong nhóm phơi nhiễm) =120/400 = 0.30. Xác suất tăng huyết áp ở người không hút thuốc lá, P(H n__o__n__S) được ký hiệu là Io (mới mắc trong nhóm không phơi nhiễm) =30/600 = 0.05. R__R = Ie/Io = 0.3/0.05 = 6.0.

Một RR nhiều hơn 1 cho thấy yếu tố là có mối liên quan dương với bệnh (phơi nhiễm gia tăng cơ hội bệnh, v.d. hút thuốc lá) và RR ít hơn 1 cho thấy một yếu tố bảo vệ (phơi nhiễm giảm cơ hội bệnh, v.d. vắc xin). Lưu ý là trong nghiên cứu đoàn hệ, do “dân số nguy cơ” được theo dõi và tất cả các ca mới mắc (trong thời khoảng cụ thể) đều được xác định, nên có thể tính được số đo chính xác về xác suất (nguy cơ). Tổng các cột (tổng số mắc bệnh và không mắc bệnh) không phải là mẫu số thích hợp cho bất kỳ xác suất nào.

Một số đo khác thường bắt nguồn từ xác suất bệnh trong hai nhóm là nguy cơ quy trách (AR): nguy cơ tăng thêm trong nhóm phơi nhiễm so với nhóm không phơi nhiễm. Đây đơn thuần là sự khác biệt giữa hai xác suất: A__R = Ie − Io = 0.30 − 0.05 = 0.25 Hai mươi lăm phần trăm số ca mới mắc tăng huyết áp trong nhóm phơi nhiễm có thể quy trách cho việc hút thuốc lá. Đôi khi AR được diễn tả là phần trăm số mới mắc trong toàn dân số và số này được gọi là phần trăm nguy cơ quy trách (A__RP):

AR_P &= (I_T- I_o/ I_T ) 100 &= [(0.15 - 0.05) /0.15] 100 &= 66.6%

Số đo này về mặt toán học là tương đương với: A__RP = Pe(R__R − 1)/[1 + Pe(R__R − 1)] với Pe là tỷ lệ dân số phơi nhiễm. Một số đo nguy cơ quy trách khác là phần trăm bệnh căn (EF) là tỷ số giữa AR với số mới mắc trong nhóm phơi nhiễm. Số đo này trả lời cho câu hỏi “bao nhiêu phần trăm ca bệnh trong nhóm phơi nhiễm có thể quy cho yếu tố phơi nhiễm?”

EF &= (I_e - I_o) / I_e &= (0.30 - 0.05) / 0.30 &= 83.3%

Số đo này về mặt toán học là tương đương với: E__F = (R__R − 1)/R__R = 1 − 1/R__R

Do vậy, trong nghiên cứu trên, 66.6% trường hợp tăng huyết áp trong dân số có thể quy cho hút thuốc lá và 83.3% ca tăng huyết áp trong nhóm hút thuốc lá có thể quy cho việc hút thuốc lá. Cả hai số đo này có thể dùng để ước lượng số ca có thể phòng ngừa nếu yếu tố nguy cơ được loại trừ khỏi dân số, và do đó là một công cụ y tế công cộng hữu ích khi phát triển các chương trình phòng ngừa bệnh tật.

Tóm lại, trong một nghiên cứu đoàn hệ, các kết quả được lập bảng để cho dạng bảng 2 × 2 về phơi nhiễm và tình trạng bệnh như sau:

Bảng 2 × 2 trong dịch tễ học

         
    Không Tổng
Phơi nhiễm a b a + b
  Không c d c + d
  Tổng a + c b + d a + b + c + d

[tab:bang22]

Sau đó,

I_e &= a/(a+b); I_o = c/ (c+d) &= [a/(a+b)]/ [c/(c+d)] = a(c+d) / c/(a+b) &= [a/(a+b)] - [c/(c+d)] _P &= [(a+b/N) (-1)] / [1+(a+b/N) (-1)] &= 1 - 1/.

Nghiên cứu bệnh-chứng

Trong nghiên cứu bệnh-chứng, đương nhiên là không thể đo lường được số mới mắc và do đó không thể ước lượng được nguy cơ tương đối. Tuy vậy nếu bệnh là hiếm, có thể tính được một số đo xấp xỉ. Số đo này được gọi là tỷ số số chênh (OR). Giả sử rằng bảng [tab:bang22] trình bày dữ kiện của một nghiên cứu bệnh-chứng. Bây giờ tổng (a + c) và (b + d) được thu thập theo thiết kế và do đó là các mẫu số thích hợp, trong khi các số (a + b) và (c + d) là các kết quả của nghiên cứu và không phải là mẫu số thích hợp. Xác suất duy nhất đo được là tỷ lệ có phơi nhiễm yếu tố nguy cơ trong nhóm bệnh (a + c) và không bệnh (b + d). Một số đo liên quan đến xác suất là “số chênh” của một sự kiện. Trong những người mắc bệnh, số chênh bị phơi nhiễm là a/b, và số này trong nhóm không mắc bệnh là c/d. Tỷ số của các số chênh này được gọi là tỷ số số chênh.

Lưu ý là OR = (a/b)/(c/d)=a__d/b__c được tính dễ dàng từ các bảng kết quả dạng bảng 2 × 2, và cũng có thể chứng minh đây là một xấp xỉ tốt cho RR khi bệnh là hiếm. RR = [a/(a + b)]/[c/(c + d)] = (a__c + a__d)/(a__c + b__c).

Nếu bệnh là hiếm, (a__c) là nhỏ hơn nhiều so với (a__d) và (b__c) và công thức trên trở nên xấp xỉ bằng a__d/b__c = OR.

Do đó trong một nghiên cứu bệnh-chứng, tỷ số số chênh (OR) được sử dụng đo lường mối liên quan giữa bệnh và yếu tố nguy cơ. Lưu ý rằng các số đo quy trách là không thể tính được trong trường hợp này do các ca bệnh và chứng là đã được chọn trước và do đó không thể tính được số mới mắc. Tuy nhiên một số nhà nghiên cứu sử dụng ước lượng OR để thay thế cho RR trong các công thức AR và EF để tính các số đo tương tự; nói chung cách này là không hợp lý. Trong trường hợp đặc biệt khi hiện mắc bệnh là rất thấp, lý luận rằng RR có thể được xấp xỉ bằng với OR khi số mới mắc là thấp có thể chấp nhận được.

Trong ví dụ trên, nếu cũng cùng kết quả như trên được thu thập từ một nghiên cứu bệnh-chứng gồm 150 ca tăng huyết áp và 850 người không tăng huyết áp, bảng sẽ trình bày như sau:

Mối liên quan giữa hút thuốc lá và tăng huyết áp - nghiên cứu bệnh-chứng

         
    Không Tổng
Hút thuốc lá 120 280 *
  Không 30 570 *
  Tổng 150 850 1000

[tab:chap7htlthabc]

Nghiên cứu cắt ngang

Trong các nghiên cứu cắt ngang, dân số chọn mẫu là toàn dân số. Do đó, cả hiện mắc bệnh và hiện mắc yếu tố nguy cơ đều có thể được ước lượng. Ở đây tất cả các yếu tố trong bảng 2 × 2 là những số đo thích hợp và cho phép tính toán các xác suất phù hợp. Tuy nhiên lưu ý là các xác suất không phải là “nguy cơ mắc bệnh” mà các số đo hiện mắc.

Tất cả các số đo trình bày ở trên có thể tính toán được từ bảng 2 × 2 và ngoại trừ việc ta đang nói về hiện mắc chứ không phải mới mắc, các giải thích đều là đúng. RR và OR sẽ được tính tương tự, cũng có thể tính được các đại lượng khác như AR và EF. Nếu hiện mắc và mới mắc là giống nhau, các số đo này có thể có cùng cách diễn giải. Quan trọng hơn là kiểm định giả thuyết theo các xác suất này là phù hợp với thiết kế nghiên cứu đang sử dụng và sẽ cho cơ sở để tiếp tục tinh chỉnh nguy cơ trong các nghiên cứu có thiết kế tốt hơn (đoàn hệ, thực nghiệm hoặc chuẩn thực nghiệm).

Trong bảng trình bày các đối tượng, tất cả các ô bây giờ đều là số có giá trị hợp lệ. Bảng phía trên nếu thu thập từ nghiên cứu cắt ngang sẽ là:

Mối liên quan giữa hút thuốc lá và tăng huyết áp - nghiên cứu cắt ngang

         
    Không Tổng
Hút thuốc lá 120 280 400
  Không 30 570 600
  Tổng 150 850 1000

[tab:chap7htlthacn]

Biến thiên thống kê trong các đo lường

Lưu ý rằng tất cả các số đo ở trên là các ước lượng điểm của số đo sự kết hợp. Do nghiên cứu thường dựa trên mẫu, ta cần xác định “sai số ngẫu nhiên” liên quan với các ước lượng này, cụ thể là khoảng các giá trị có thể mà số đo thật nằm trong. Cần phải phát triển phân bố xác suất của các số đo này và từ đó tính toán khoảng tin cậy phù hợp. Những khái niệm này được trình bày chi tiết hơn trong các chương sau. Ta thường có thể tính “sai số chuẩn” của ước lượng và dùng giá trị này tính khoảng tin cậy sử dụng xấp xỉ phân phối bình thường (cụ thể là ước lượng ± 2 sai số chuẩn sẽ cho xấp xỉ khoảng tin cậy 95% của số đo nguy cơ).

Comments

comments powered by Disqus