Nghiên cứu đoàn hệ hồi cứu là gì? Các nghiên cứu khoa học

Nghiên cứu đoàn hệ hồi cứu là thiết kế quan sát xác định nhóm dân số dựa trên tình trạng phơi nhiễm đã xảy ra trong quá khứ rồi truy cứu hồ sơ để đánh giá kết cục sức khỏe. Phương pháp này tận dụng dữ liệu lịch sử như hồ sơ y tế hay cơ sở bảo hiểm, cho phép ước tính mối liên hệ nhân quả giữa phơi nhiễm và bệnh lý sau thời gian theo dõi.

Định nghĩa và cơ sở lý thuyết

Nghiên cứu đoàn hệ hồi cứu (retrospective cohort study) là loại nghiên cứu quan sát, trong đó người nghiên cứu xác định trước nhóm đối tượng (cohort) dựa trên tình trạng phơi nhiễm đã xảy ra trong quá khứ, sau đó truy ngược hồ sơ để đánh giá kết cục sức khỏe. Phương pháp này tận dụng dữ liệu lịch sử như hồ sơ y tế điện tử, cơ sở dữ liệu bảo hiểm để theo dõi diễn tiến của bệnh và mối liên hệ với yếu tố nguy cơ đã ghi nhận trước đó.

Cơ sở lý thuyết của nghiên cứu đoàn hệ hồi cứu dựa trên nguyên lý xác định thứ tự thời gian: phơi nhiễm phải diễn ra trước khi kết cục xuất hiện. Điều này duy trì tính nhân quả tạm thời (temporality) và cho phép ước tính tỷ lệ nguy cơ (risk ratio) hoặc tỷ lệ chênh (odds ratio) giữa nhóm phơi nhiễm và nhóm đối chứng. Nghiên cứu hồi cứu thường được so sánh với đoàn hệ tiến cứu (prospective cohort), điểm mạnh là tiết kiệm thời gian và chi phí, điểm yếu là phụ thuộc vào chất lượng dữ liệu lịch sử.

Lý thuyết sinh học và dịch tễ học cung cấp nền tảng để chọn phơi nhiễm và kết cục phù hợp: ví dụ nghiên cứu liên quan thuốc, môi trường làm việc, chế độ dinh dưỡng. Nghiên cứu phải xác định rõ giả thuyết, cơ chế tác động và đường dẫn sinh học giữa phơi nhiễm và kết cục. Việc lựa chọn phơi nhiễm và kết cục đúng đắn giúp giảm sai lệch đo lường và tăng độ tin cậy kết quả.

Thiết kế nghiên cứu

Thiết kế đoàn hệ hồi cứu gồm các bước chính: (1) xác định nhóm phơi nhiễm và nhóm đối chứng dựa trên dữ liệu lịch sử, (2) thiết lập mốc thời gian t0 là thời điểm phân nhóm, (3) xác định khoảng thời gian theo dõi đến khi xảy ra kết cục hoặc kết thúc nghiên cứu. Mốc t0 thường là ngày bắt đầu dùng thuốc, ngày khám bệnh đầu tiên hoặc mốc thu thập mẫu xét nghiệm.

Tiêu chí lựa chọn (inclusion) và loại trừ (exclusion) thành viên đoàn hệ phải rõ ràng: ví dụ tuổi ≥18, có hồ sơ y tế đầy đủ tối thiểu 5 năm, không có bệnh nền tại t0. Tiêu chí loại trừ gồm mất liên lạc, chuyển nơi ở, dữ liệu phơi nhiễm/kết cục không xác định được. Việc này giúp giảm sai lệch chọn mẫu (selection bias) và đảm bảo tính nhất quán trong nhóm nghiên cứu.

Thiết kế còn bao gồm kế hoạch thu thập dữ liệu bổ sung và kiểm định tính đầy đủ của nguồn dữ liệu. Đối với hồ sơ điện tử, cần kiểm tra tính liên tục của ghi chép, mức độ chi tiết của phơi nhiễm (liều, tần suất), ghi nhận lâm sàng và xét nghiệm. Thiết kế phải nêu rõ quy trình kiểm soát chất lượng dữ liệu, bao gồm kiểm tra chéo (data validation) và xử lý dữ liệu thiếu (missing data).

Chọn mẫu và nguồn dữ liệu

Nguồn dữ liệu trong đoàn hệ hồi cứu thường là hồ sơ y tế điện tử (EMR), cơ sở dữ liệu bảo hiểm y tế, sổ khám bệnh, cơ sở dữ liệu dân số. Ưu điểm là quy mô lớn, đa dạng thông tin; nhược điểm là không kiểm soát được quá trình thu thập ban đầu, có thể thiếu sót thông tin phơi nhiễm hoặc kết cục.

Quy trình chọn mẫu gồm lọc toàn bộ hồ sơ thỏa mãn tiêu chí lựa chọn, sau đó phân nhóm theo phơi nhiễm. Ví dụ, trong nghiên cứu tác động của thuốc kháng viêm không steroid (NSAIDs) lên chức năng thận, nhóm phơi nhiễm là những bệnh nhân đã dùng NSAIDs ≥3 tháng trước đây, nhóm đối chứng là bệnh nhân tương đồng chưa từng dùng NSAIDs.

Đánh giá chất lượng dữ liệu bao gồm kiểm tra tỉ lệ missing data, phân bố đặc điểm nhân khẩu học (tuổi, giới, BMI), và so sánh tính đồng nhất giữa hai nhóm. Thống kê mô tả (mean, median, SD, IQR) và bảng so sánh (table) giúp trực quan hóa sự khác biệt ban đầu, hỗ trợ điều chỉnh đa biến sau này.

Đặc điểmNhóm phơi nhiễm (n=500)Nhóm đối chứng (n=500)
Tuổi trung bình (SD)55.2 (12.1)54.8 (11.9)
Tỉ lệ nam (%)48%50%
BMI trung vị (IQR)27.5 (24.0–31.0)27.2 (23.8–30.5)

Xác định phơi nhiễm

Phơi nhiễm (exposure) phải được định nghĩa rõ ràng và đo lường chính xác từ dữ liệu lịch sử. Ví dụ, phơi nhiễm thuốc là ngày bắt đầu đơn thuốc, liều dùng và thời gian điều trị. Phơi nhiễm môi trường có thể dựa trên bản đồ GIS và dữ liệu quan trắc khí thải, nồng độ ô nhiễm không khí.

Cần phân loại mức độ phơi nhiễm thành các cấp (E1, E2, E3…) dựa trên liều tích lũy hoặc tần suất tiếp xúc để đánh giá mối quan hệ liều – kết cục. Việc phân cấp giúp phát hiện ngưỡng tác động và xây dựng mô hình dose–response.

Đánh giá độ tin cậy của ghi nhận phơi nhiễm bằng cách so sánh nhiều nguồn dữ liệu (hồ sơ y tế vs. dược phẩm; giám sát tại nơi làm việc vs. báo cáo người lao động), tính toán hệ số Kappa hoặc tỉ lệ khớp đoán nhận (sensitivity/specificity) để đảm bảo sai lệch đo lường (misclassification) ở mức tối thiểu.

Xác định kết cục

Kết cục (outcome) là biến quan trọng cần đo đạc trong nghiên cứu đoàn hệ hồi cứu. Kết cục chính cần định nghĩa rõ ràng về mặt lâm sàng hoặc sinh học, ví dụ bệnh tim mạch, suy thận giai đoạn cuối, tử vong do mọi nguyên nhân hoặc tác dụng phụ nặng.

Dữ liệu kết cục thường lấy từ mã ICD trong hồ sơ y tế, dữ liệu bảo hiểm hoặc sổ khám chuyên khoa. Việc sử dụng tiêu chuẩn chẩn đoán quốc tế như ICD-10 hoặc SNOMED đảm bảo tính nhất quán giữa các cơ sở dữ liệu khác nhau và khả năng so sánh đa trung tâm.

  • Sử dụng mã ICD-10 để xác định nhồi máu cơ tim: I21.x.
  • Xác nhận tử vong thông qua cơ sở dữ liệu dân số quốc gia hoặc Cơ quan Y tế dự phòng (CDC). CDC – ICD-10-CM
  • Thời điểm xảy ra kết cục được ghi nhận là ngày nhập viện hoặc ngày tử vong theo giấy chứng tử.

Đối với kết cục biến thiên (time-to-event), cần đảm bảo tính thời thứ tự: phơi nhiễm trước t0, kết cục sau t0. Trường hợp mất theo dõi, ghi nhận là bị cắt cụt (censoring) tại ngày truy vấn cuối cùng.

Kiểm soát nhiễu và sai lệch

Biến nhiễu (confounders) là yếu tố liên quan đồng thời đến phơi nhiễm và kết cục, có thể làm sai lệch ước tính mối liên hệ. Ví dụ nghiên cứu NSAIDs và suy thận phải điều chỉnh tuổi, giới, bệnh nền tiểu đường, tăng huyết áp.

  • Sử dụng phân tích đa biến (multivariable regression) đưa các biến nhiễu vào mô hình.
  • Ghép cặp theo điểm propensity score matching để cân bằng đặc điểm ban đầu giữa nhóm exposed và unexposed. PubMed – Propensity Score
  • Đánh giá sai lệch chọn mẫu (selection bias) và sai lệch thông tin (information bias) bằng phân tích sensitivity và thiết kế nested case–control bên trong cohort.

Thiết kế nested case–control cho phép lấy mẫu nhanh và hiệu quả khi kết cục hiếm, đồng thời duy trì lợi thế theo dõi đoàn hệ. Phương pháp này giảm chi phí xét nghiệm và phân tích so với xử lý toàn bộ cohort.

Phân tích thống kê

Mô hình Cox proportional hazards là công cụ phổ biến để đánh giá ảnh hưởng của phơi nhiễm lên nguy cơ xảy ra kết cục theo thời gian.

Công thức mô hình Cox cơ bản: λ(tX)=λ0(t)exp(β1X1+β2X2++βpXp)\lambda(t|X)=\lambda_0(t)\exp(\beta_1 X_1 + \beta_2 X_2 + \dots + \beta_p X_p), trong đó X là bộ biến giải thích bao gồm phơi nhiễm và biến nhiễu, \lambda_0(t) là hazard cơ sở.

  • Ước tính hazard ratio (HR) kèm khoảng tin cậy 95% (CI).
  • Kiểm tra giả thuyết proportional hazards bằng Schoenfeld residuals.
  • Phân tích nhạy cảm (sensitivity analysis) thay đổi ngưỡng phơi nhiễm, phương pháp xử lý dữ liệu thiếu (multiple imputation) để đánh giá độ ổn định kết quả.

Biểu đồ Kaplan–Meier minh họa xác suất sống sót tự do kết cục theo thời gian giữa các nhóm. Sử dụng kiểm định log-rank để so sánh đường cong giữa nhóm exposed và unexposed.

Ưu điểm và hạn chế

Ưu điểm: tiết kiệm thời gian và chi phí nhờ tận dụng dữ liệu có sẵn; phù hợp với nghiên cứu phơi nhiễm hiếm hoặc diễn ra trước thời điểm nghiên cứu; khả năng thu thập mẫu lớn, tăng tính mạnh thống kê.

Hạn chế: phụ thuộc chất lượng và độ đầy đủ của dữ liệu lịch sử; nguy cơ sai lệch đo lường nếu phơi nhiễm, kết cục không được ghi chép chính xác; sai lệch chọn mẫu nếu mất theo dõi không ngẫu nhiên; khó kiểm soát biến nhiễu chưa ghi nhận.

  • Thiếu thông tin về yếu tố lối sống, đa phần không có dữ liệu về hút thuốc, ăn uống.
  • Dữ liệu thiếu chi tiết về liều phơi nhiễm, tần suất, không phân tích liều – đáp ứng.
  • Phải xử lý missing data và cắt cụt, có thể giảm kích thước mẫu hiệu quả.

Yêu cầu đạo đức và quy định

Nghiên cứu sử dụng dữ liệu thứ cấp phải được phê duyệt bởi hội đồng đạo đức (IRB/REC) và tuân thủ quy định bảo vệ thông tin cá nhân (GDPR tại châu Âu, HIPAA tại Mỹ). Dữ liệu phải được mã hóa (de-identification) để bảo mật danh tính.

Cần có giấy phép truy cập cơ sở dữ liệu y tế và cam kết không tiết lộ thông tin bệnh nhân. Báo cáo phải nêu rõ nguồn dữ liệu và phương pháp bảo mật, đồng thời cho phép cơ quan kiểm tra độc lập xác minh quy trình thu thập và xử lý.

WHO – Ethical issues in public health surveillance

Tiêu chuẩn báo cáo và chất lượng

Tuân thủ hướng dẫn STROBE (Strengthening the Reporting of Observational Studies in Epidemiology) giúp đảm bảo báo cáo đầy đủ thiết kế, phân tích và hạn chế. Đặc biệt, checklist STROBE-cohort tập trung vào nghiên cứu đoàn hệ.

  • Ghi rõ phương pháp chọn mẫu, tiêu chí lựa chọn và loại trừ.
  • Mô tả chi tiết biến phơi nhiễm, kết cục và biến nhiễu.
  • Báo cáo kết quả phân tích đa biến, HR với CI và p-value.
  • Thảo luận minh bạch ưu điểm, hạn chế và khả năng khái quát hóa.

STROBE Statement

Tài liệu tham khảo

  • Vandenbroucke JP, von Elm E, Altman DG, et al. “Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration.” Int J Epidemiol. 2007;36(6):1516–1539. STROBE
  • Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 3rd ed. Lippincott Williams & Wilkins; 2008.
  • Song JW, Chung KC. “Observational Studies: Cohort and Case-Control Studies.” Plast Reconstr Surg. 2010;126(6):2234–2242.
  • Hernán MA, Robins JM. “Using Big Data to Emulate a Target Trial When a Randomized Trial Is Not Available.” Am J Epidemiol. 2016;183(8):758–764.
  • CDC. “Principles of Epidemiology in Public Health Practice,” 3rd ed. 2012. CDC Epi Manual
  • WHO. “World Health Organization guideline on ethical issues in public health surveillance.” 2017. WHO Surveillance Ethics

Các bài báo, nghiên cứu, công bố khoa học về chủ đề nghiên cứu đoàn hệ hồi cứu:

Các xu hướng tạm thời về tỷ lệ tử vong theo nguyên nhân ở những cá nhân vừa được chẩn đoán rung nhĩ trong Nghiên cứu Tim Framingham Dịch bởi AI
BMC Medicine - - 2021
Tóm tắt Giới thiệu Tỷ lệ tử vong do tất cả nguyên nhân sau rung nhĩ (AF) đã giảm theo thời gian. Dữ liệu về các xu hướng thời gian trong các nguyên nhân tử vong ở những cá nhân mắc AF còn hạn chế. Mục tiêu của nghiên cứu của chúng tôi là phân tích các xu hướng tạm thời trong tỷ lệ tử vong theo nguyê...... hiện toàn bộ
#rung nhĩ #tỷ lệ tử vong #bệnh tim mạch #Nghiên cứu Tim Framingham #yếu tố dự đoán #xu hướng tạm thời
Tỷ lệ sinh sống của việc tích lũy noãn đông lạnh trong quản lý dự trữ buồng trứng giảm: một nghiên cứu đoàn hệ hồi cứu Dịch bởi AI
Journal of Ovarian Research - Tập 16 Số 1
Tóm tắt Nền tảng Tích lũy noãn M-II đông lạnh để tiêm tinh trùng cùng lúc đã được sử dụng để quản lý tình trạng dự trữ buồng trứng giảm (POR). Nghiên cứu của chúng tôi nhằm xác định xem chiến lược tích lũy noãn đông lạnh có cải thiện tỷ lệ sinh sống (LBR) trong việc quản lý dự trữ buồng trứng giảm (...... hiện toàn bộ
Sự kết hợp giữa PIVKA-II và alpha-fetoprotein đối với giá trị chẩn đoán của các khối u gan ở trẻ em: một nghiên cứu quan sát tiến cứu đa trung tâm Dịch bởi AI
Hepatology International -
Tóm tắt Bối cảnh Nghiên cứu xem liệu protein được cảm ứng bởi chất đối kháng vitamin K-II (PIVKA-II) kết hợp với alpha-fetoprotein (AFP) có thể cải thiện độ chính xác trong chẩn đoán và phân biệt các khối u gan ở trẻ em. Phương pháp... hiện toàn bộ
#PIVKA-II #Alpha-fetoprotein (AFP) #Khối u gan #Trẻ em #Nghiên cứu quan sát tiến cứu #Chẩn đoán phân biệt #Đa trung tâm #Bệnh học
Tỷ lệ xuất hiện và các yếu tố nguy cơ của hiện tượng vỡ trong vòng 90 ngày sau phẫu thuật Hartmann первичный: một nghiên cứu đoàn hệ hồi cứu Dịch bởi AI
Springer Science and Business Media LLC - Tập 408 Số 1
Tóm tắt Mục đích Tài liệu đang báo cáo về sự xuất hiện khác nhau (3–33%) của hiện tượng vỡ của phần trực tràng còn lại sau phẫu thuật Hartmann, và có sự thiếu hụt các phân tích đa biến về các yếu tố nguy cơ tiềm ẩn cho hiện tượng vỡ sau khi thực hiện phẫu thuật Hartmann. Chúng tôi nhằm mục đích ước ...... hiện toàn bộ
Tỷ lệ mắc bệnh, đặc điểm lâm sàng và kết quả sống của các bệnh lý u buồng trứng: một nghiên cứu đoàn hệ hồi cứu Dịch bởi AI
Springer Science and Business Media LLC - Tập 23 - Trang 1-8 - 2023
Struma ovarii (SO) là một loại khối u hiếm gặp và có thể chuyển đổi thành carcinoid buồng trứng dạng u (OSC) và/hoặc struma ovarii ác tính (MSO), nhưng tỷ lệ mắc, đặc điểm lâm sàng và kết quả sống chưa được xác định rõ ràng. Chúng tôi đã tiến hành một nghiên cứu hồi cứu về các bệnh nhân có bệnh lý struma buồng trứng được điều trị tại bệnh viện của chúng tôi trong giai đoạn 1980 và 2022. Các phân t...... hiện toàn bộ
#Struma ovarii #Ovarian strumal carcinoid #Malignant struma ovarii #Ovarian teratoma #Survival outcomes
Mối liên hệ giữa điểm số Thang đánh giá yếu đuối lâm sàng và tỷ lệ tử vong tại bệnh viện ở bệnh nhân người lớn mắc COVID-19 (COMET): một nghiên cứu quan sát đoàn hệ hồi cứu đa trung tâm quốc tế Dịch bởi AI
The Lancet Healthy Longevity - Tập 2 - Trang e163 - 2021
Nền tảng Trong đại dịch COVID-19, sự thiếu hụt tài nguyên đã buộc phải phân loại điều trị cấp cứu cho bệnh nhân mắc bệnh. Đối với những bệnh nhân từ 65 tuổi trở lên, quyết định phân loại thường dựa trên mức độ yếu đuối được đo lường bằng Thang đánh giá yếu đuối lâm sàng (CFS). Tuy nhiên, CFS cũng có thể hữu ích cho những bệnh nhân dưới 65 tuổi. Chúng tôi đặt mục tiêu xem xét mối liên hệ giữa điểm ...... hiện toàn bộ
#COVID-19 #Thang đánh giá yếu đuối lâm sàng #tỷ lệ tử vong tại bệnh viện #chăm sóc tích cực #nghiên cứu quan sát
Melanosis coli: hiệu ứng tương phản hay hiệu ứng ung thư? Nghiên cứu đoàn hệ hồi cứu quy mô lớn Dịch bởi AI
International Journal of Colorectal Disease - Tập 38 - Trang 1-10 - 2023
Melanosis coli được đặc trưng bởi niêm mạc màu nâu với sự tăng sắc tố. Các nghiên cứu đã chỉ ra tỷ lệ phát hiện adenoma cao hơn ở những bệnh nhân melanosis, tuy nhiên sự gây ra do hiệu ứng tương phản hay hiệu ứng ung thư vẫn còn gây tranh cãi. Tỷ lệ phát hiện polyp răng cưa ở bệnh nhân melanosis vẫn chưa được biết đến. Nghiên cứu này nhằm làm rõ mối tương quan giữa tỷ lệ phát hiện adenoma với mela...... hiện toàn bộ
#melanosis coli #tỷ lệ phát hiện adenoma #polyp răng cưa #nội soi #bệnh lý ruột
Việc sử dụng atropine có thể dẫn đến tình trạng toan hô hấp sau phẫu thuật ở trẻ sơ sinh được phẫu thuật thắt ống động mạch: Nghiên cứu đoàn hệ hồi cứu Dịch bởi AI
Pediatrics & Neonatology - Tập 59 - Trang 136 - 2018
Nền tảng Ống động mạch tạm thời (PDA) là một trong những tình trạng tim mạch phổ biến nhất ở trẻ sơ sinh sinh non. Việc đóng PDA ở những bệnh nhân có triệu chứng có thể đạt được bằng phương pháp điều trị nội khoa hoặc phẫu thuật. Atropine thường được sử dụng trong gây mê toàn thân như một liệu pháp tiền mê trong nhóm tuổi này nhưng có rất ít bằng chứng về tác động của nó. Nghiên cứu của chúng tôi ...... hiện toàn bộ
#respiratory acidosis #atropine #patent ductus arteriosus #ketamine
Tỷ lệ ung thư mới khởi phát ở bệnh nhân nhồi máu cơ tim – một nghiên cứu đoàn hệ quốc gia Dịch bởi AI
BMC Cardiovascular Disorders - Tập 18 - Trang 1-9 - 2018
Một số nghiên cứu đã chỉ ra rằng bệnh nhân nhồi máu cơ tim (MI) có thể có nguy cơ cao hơn về ung thư, nhưng cần có thêm các nghiên cứu lớn dựa trên hồ sơ bệnh án để đánh giá đề tài này. Mục tiêu của nghiên cứu này là đánh giá tỷ lệ mới mắc ung thư và tử vong theo tiền sử nhồi máu cơ tim, và liệu nhồi máu cơ tim có liên quan độc lập đến ung thư hay không trong một nghiên cứu đoàn hệ lớn. Tất cả cư ...... hiện toàn bộ
#nhồi máu cơ tim #ung thư #tỷ lệ mắc ung thư #nghiên cứu đoàn hệ #sức khỏe cộng đồng
Tác động của việc tiếp xúc với thuốc diệt côn trùng gia đình không thuộc nhóm phospho hữu cơ trong thời kỳ mang thai đến kích thước ra đời và tốc độ phát triển của trẻ sơ sinh: một nghiên cứu theo nhóm Dịch bởi AI
Springer Science and Business Media LLC - Tập 20 - Trang 1-8 - 2020
Cho đến nay, có rất ít bằng chứng về tác động của việc tiếp xúc với thuốc diệt côn trùng gia đình không thuộc nhóm phospho hữu cơ đối với sức khỏe của trẻ sơ sinh. Giả thuyết của chúng tôi là việc tiếp xúc với thuốc diệt côn trùng gia đình không thuộc nhóm phospho hữu cơ sẽ liên quan đến kích thước sơ sinh và tốc độ phát triển của trẻ sơ sinh. Trong nghiên cứu đoàn hệ có tính tiên lượng này, 284 c...... hiện toàn bộ
#thuốc diệt côn trùng #phospho hữu cơ #sinh trắc học #sức khỏe trẻ sơ sinh #nghiên cứu đoàn hệ
Tổng số: 32   
  • 1
  • 2
  • 3
  • 4