Biến số nghiên cứu

October 20, 2012 by Admin

Do nghiên cứu khoa học là việc thu thập, phân tích và lí giải số liệu để giải quyết vấn đề nghiên cứu hay trả lời một câu hỏi nghiên cứu (Varkevisser et al., 1991) nên nghiên cứ khoa học cần phải thu thập thông tin các đặc tính hay các đại lượng của đối tượng. Các đặc tính hay đại lượng này được gọi là biến số. Nói cách khác:

Biến số là những đại lượng hay những đặc tính có thể thay đổi từ người này sang người khác hay từ thời điểm này sang thời điểm khác.

Biến số định tính - biến số định lượng - biến số sống còn

- Nếu biến số thể hiện một đại lượng nó được gọi là biến số định lượng (quantitative variable). Biến số định lượng nhằm thể hiện một đại lượng và do đó có giá trị là những con số và biến số định lượng phải luôn luôn đi kèm theo đơn vị.

Thí dụ: tuổi là biến số liên tục bởi vì ta có thể nói người này 20 tuổi, người kia 32 tuổi, v.v.
Những thí dụ khác là đường huyết, hemoglobin, hematocrite, chiều cao, cân nặng, thu nhập, v.v
Biến số định lượng có thể còn được chia thành
a- Biến số tỉ số - ratio variable(có giá trị không tuyệt đối) và
b- Biến số khoảng - interval variable (không có giá trị không tuyệt đối)

- Nếu biến số nhằm thể hiện một đặc tính, biến số được gọi là biến số định tính.
Biến số định tính còn được chia làm 3 loại:

a- Biến số nhị giá - binary variable (khi chỉ có 2 giá trị): Giới tính là biến số nhị giá do chỉ có hai giá trị là nam và nữ.

b- Biến số danh định - nominal variable (khi có 3 hay nhiều hơn các giá trị và các bản thân các giá trị không có tính chất thứ tụ):
- Biến số danh định là biến số mà giá trị của nó không thể biểu thị bằng số mà phải biểu diễn bằng một tên gọi (danh: tên) và các giá trị này không thể sắp đặt theo một trật tự từ thấp đến cao.

Thí dụ: Biến số dân tộc với các giá trị: Kinh, Khmer, Hoa, Chăm,… là biến số định tính vì chúng ta không thể sắp xếp các giá trị này từ theo một trật tự từ thấp đến cao hay ngược lại.
Một số thí dụ khác của biến số danh định là tình trạng hôn nhân (có 4 giá trị: độc thân, có gia đình, li dị, góa) nhóm máu (A, B, AB và O).

c- Biến số thứ tự - ordinal variable (khi có 3 hay nhiều hơn các giá trị và các bản thân các giá trị có tính chất thứ tự
Biến số thứ tự là biến số danh định nhưng có thể sắp xếp thứ tự được.

Thí dụ: tình trạng kinh tế xã hội (giàu, khá, trung bình, nghèo, rất nghèo) là biến số thứ tự bởi vì người giàu có điều kiện kinh tế tốt hơn người khá, người khá hơn người trung bình, trung bình hơn nghèo, v.v
Những thí dụ khác là học lực của học sinh (giỏi, khá, trung bình, kém), tiên lượng (tốt, khá, xấu, tử vong).

Trong phân tích thống kê, để tiện việc nhập số liệu hay lí giải kết quả, người ta có thể ánh xạ (mapping) các giá trị của biến định tính vào các con số. Việc này được gọi là mã hóa và cần hiểu rằng việc mã hóa này hoàn toàn có tính chất áp đặt và các con số được dùng trong mã hóa không phản ánh bản chất của biến số định tính. Chúng ta có thể mã hóa giới tính và quy ước Nam là 1 và Nữ là 2. Tuy nhiên việc mã hóa này là áp đặt và chúng ta hoàn toàn có thể quy ước Nam là 1 và Nữ là 0. Việc mã hóa chỉ nhằm giúp việc nhập số liệu và xử lí số liệu trở nên dễ dàng hơn chứ không nhằm phản ánh bản chất của biến số đó (do đó hoàn toàn vô căn cứ nếu cho rằng mã hóa Nam=1 và Nữ=0 là phản ánh thái độ phong kiến "Nhất nam viết hữu - Thập nữ viết vô). Riêng đối với biến số thứ tự thì việc mã hóa phải phù hợp với bản chất thứ tự của biến số.
- Ngoài ra có khi biến cố không chỉ được quan tâm về phương diện nó có xảy ra hay chưa xảy ra mà còn được quan tâm về phương diện biến cố xảy ra vào lúc nào. Thí dụ sau khi điều trị bệnh nhân ung thư chúng ta không chỉ quan tâm bệnh nhân có tử vong hay không mà còn quan tâm bệnh nhân bệnh nhân tử vong bao nhiêu lâu sau khi điều trị và nếu bệnh nhân chưa tử vong, bệnh nhân đã sống được bao lâu. Loại biến số này được gọi là biến sống còn (survival variale) và được thể hiện bởi 2 biến số một biến số nhị giá (có biến cố xảy ra hay không) và một biến số định lượng (biến cố xảy ra vào lúc nào)

Cần phân biệt sự khác biệt giữa biến số và giá trị của biến số (còn gọi là yếu tố): Giới tính là biến số nhưng Nữ không phải là biến số mà là một giá trị của biến số (hay còn gọi là yếu tố). Thời gian chờ đợi để được sử dụng dịch vụ y tế là biến số nhưng thời gian chờ đợi lâu là giá trị của biến số. Kiến thức về các cây con thuốc là biến số nhưng ít hiểu biết về các cây con thuốc là yếu tố. Ta có thể nói biến số mức độ hút thuốc lá có liên quan đến nguy cơ ung thư phổi nhưng phải nói hút thuốc lá nặng là yếu tố nguy cơ của ung thư phổi.

Biến số (đại lượng hay đặc tính được quan tâm) được chia làm 3 loại:
- Biến số có thể đo lường trực tiếp - chiều cao, cân nặng, tuổi, tình trạng hôn nhân.v.v
- Biến số không thể đo lường trực tiếp được như tình trạng dinh dưỡng, mức độ đắc khí, mức độ hài lòng của bệnh nhân, kiến thức của bà mẹ về thực hành chăm sóc trẻ.
- Biến số không đo lường được trong nghiên cứu hiện tại. Trên nguyên tắc, mọi biến số đều có thể đo lường được nhưng trong một nghiên cứu cụ thể có thể có một số biến số không đo lường được do hạn chế của điều kiện kĩ thuật hay không thống nhất về định nghĩa cụ thể (thí dụ nồng độ endorphine gia tăng sau khi châm cứu, mức độ hữu dụng của những bệnh nhân bị tàn tật, chất lượng dân số)

Ðịnh nghĩa cụ thể
Thông thường, nhà nghiên cứu bắt đầu với một quan điểm tương đối mơ hồ về cách đo lường các biến số nghiên cứu. Thí dụ, nếu nhà nghiên cứu muốn đo lường mức độ đau thì nhà nghiên cứu phải chuyển đổi khái niệm đau thành một mệnh đề chặt chẽ xác định cách đo lường biến số này. Phụ thuộc vào cách lí giải trừu tượng của khái niệm đau và yêu cầu cụ thể của nghiên cứu, chúng ta có thể chọn lựa một phương pháp đo lương mức độ đau đớn.

Ðịnh nghĩa cụ thể của biến số là một mệnh đề về cách người nghiên cứu của một nghiên cứu nào đó chọn cách đo lường biến số đó. Nó phải không được mơ hồ và chỉ có một cách lí giải duy nhất. Thí dụ, một nhà nghiên cứu cho rằng việc điều trị của bà ta có thể giúp cải thiện việc "kiểm soát vận động", câu hỏi chúng ta cần đặt ra ngay là "kiểm soát vận động" có ý nghĩa như thế nào. Nhà nghiên cứu có thể trả lời là bà ta quan tâm đến việc kiểm soát vận động được đo lường bởi Plunkett Motor Dexterity Task Score. Một nhà nghiên cứu khác có thể không chấp nhận định nghĩa này và cho rằng việc kiểm soát vận động nên được tự đánh giá bởi bệnh nhân. Cả hai định nghĩa này được gọi là định nghĩa cụ thể.

Một định nghĩa cụ thể tốt là định nghĩa cung cấp đủ thông tin để cho phép một nhà nghiên cứu khác có thể lập lại kĩ thuật đo lường, nếu người đó muốn. Trong mô tả nghiên cứu nhà nghiên cứu nên bao gồm trong định nghĩa cụ thể những công cụ đo lường và quy trình nghiên cứu để người đọc có thể rõ ràng về những việc đã làm.

Biến số phụ thuộc - biến số độc lập - biến số gây nhiễu
Khi chúng ta quan tâm đến việc lí giải nguyên nhân của sự việc chúng ta chia biến số thành biến số độc lập và biến số phụ thuộc.

  • Biến số dùng để mô tả hay đo lường vấn đề nghiên cứu được gọi là biến số phụ thuộc.
  • Biến số dùng để mô tả hay đo lường các yếu tố được cho là gây nên (hay gây ảnh hưởng đến) vấn đề nghiên cứu được gọi là biến số độc lập

Việc xác định biến số nào là biến số độc lập hay biến số phụ thuộc được xác định trong phần đặt vấn đề và mục tiêu của nghiên cứu. Do đó trong khi thiết kế nghiên cứu cần phải xác định rõ ràng biến số nào là độc lập và biến số nào là phụ thuộc.

Thí dụ nếu nghiên cứu mối quan hệ giữa ung thư phổi và hút thuốc lá thì hút thuốc lá là biến số độc lập và ung thư phổi là biến số phụ thuộc
Nếu nhà nghiên cứu muốn tìm hiểu tại sao thanh niên hút thuốc thì hút thuốc là biến số phụ thuộc và "áp lực của bạn bè" là biến số độc lập.

Biến số gây nhiễu (confounding variable) là biến số cung cấp một giải thích khác của mối liên hệ giữa biến số độc lập và biến số phụ thuộc.

Một biến số được đánh giá là biến số gây nhiễu khi có 3 đặc tính sau:
- Có liên quan đến biến số phụ thuộc (là yếu tố nguy cơ của vấn đề nghiên cứu)
- Có liên quan đến biến số độc lập (phân bố không đều giữa các giá trị của biến độc lập)
- Không nằm trong cơ chế tác động của biến độc lập lên biến phụ thuộc

Thí dụ: Có mối liên hệ giữa số lần khám tiền sản và sanh con nhẹ hơn 2500 gram. Tuy nhiên thu nhập của gia đình cũng có thể ảnh hưởng đến số lần khám tiền sản và việc sanh con nhẹ cân. Như vậy thu nhập của gia đình là yếu tố gây nhiễu.

Kiểm soát yếu tố gây nhiễu
Ðể khắc phục yếu tố gây nhiễu người ta có thể sử dụng:

- Hạn chế trong thiết kế nghiên cứu: Nghiên cứu chỉ chọn đối tượng là những bà mẹ trong gia đình có thu nhập trung bình, không nghiên cứu những bà mẹ trong gia đình nghèo

- Bắt cặp trong thiết kế và chọn mẫu sau đó phân tầng trong phân tích: Trong quy trình chọn mẫu, nếu chọn đưa vào một phụ nữ nghèo ít đi khám thai thì cũng phải chủ ý chọn vào mẫu một phụ nữ nghèo đi khám thai đầy đủ. Nếu chọn đưa vào một phụ nữ giàu ít đi khám thai thì cũng phải chủ ý chọn vào mẫu một phụ nữ giàu đi khám thai đầy đủ. Cần lưu ý trong trường hợp bắt cặp thì phân tích thống kê được sử dụng cũng phải là phương pháp bắt cặp (thí dụ như phân tầng hay hồi quy có điều kiện)

- Phân tầng trong phân tích (không bắt cặp): Phương pháp bắt cặp trong chọn mẫu và phân tầng trong phân tích mẫu: thực chất gồm nhiều nghiên cứu và mỗi nghiên cứu hạn chế cho một giá trị của biến số gây nhiễu

- Mô hình hóa

- Phương pháp chia nhóm ngẫu nhiên: chỉ sử dụng được cho nghiên cứu thực nghiệm nhưng có lẽ là phương pháp tốt nhất để loại bỏ các yếu tố gây nhiễu bởi vì nó loại bỏ được các yếu tố gây nhiễu đã biết cũng như các yếu tố gây nhiễu chưa biết.

Biến số nền (background variables)
Trong bất cứ nghiên cứu nào, có những biến số nền tảng thí dụ như tuổi, giới, trình độ giáo dục, tình trạng kinh tế, tình trạng hôn nhân, tôn giáo, v.v. Những biến số này thường có ảnh hưởng đến vấn đề nghiên cứu (biến số phụ thuộc) và có tác động như biến số gây nhiễu. Nếu biến số nền có ảnh hưởng quan trọng đến nghiên cứu cần phải thu thập thông tin về biến số nền. Nhưng không nên thu thập quá nhiều biến số nền để tránh làm tăng kinh phí nghiên cứu một cách vô ích.

Nguồn: PGS.TS.Đỗ Văn Dũng

Comments

comments powered by Disqus