Radiomics là gì? Các bài báo nghiên cứu khoa học liên quan
Radiomics là lĩnh vực trích xuất và phân tích đặc trưng định lượng từ hình ảnh y khoa nhằm hỗ trợ chẩn đoán, tiên lượng và cá nhân hóa điều trị bệnh. Phương pháp này biến dữ liệu hình ảnh thành chỉ số sinh học số hóa, phản ánh đặc điểm mô học và gen học thông qua mô hình toán học và học máy.
Giới thiệu về Radiomics
Radiomics là một nhánh liên ngành trong y học hình ảnh, tập trung vào việc trích xuất, phân tích và mô hình hóa dữ liệu định lượng từ các hình ảnh y khoa như CT, MRI, PET. Khác với phương pháp đánh giá trực quan truyền thống, radiomics xem hình ảnh như một nguồn dữ liệu chứa đựng thông tin sinh học tiềm ẩn có thể chuyển hóa thành đặc trưng số học phục vụ chẩn đoán và tiên lượng bệnh.
Radiomics xuất phát từ nhu cầu khai thác triệt để dữ liệu hình ảnh mà bác sĩ không thể nhận biết bằng mắt thường. Ý tưởng cốt lõi là mỗi pixel/voxel không chỉ đại diện cho cấu trúc mô học mà còn mang các dấu hiệu phản ánh gen, protein, hoặc vi cấu trúc. Thay vì chỉ sử dụng hình ảnh như minh họa, radiomics biến hình ảnh thành một dạng “biomarker” định lượng có thể đưa vào mô hình học máy để hỗ trợ ra quyết định lâm sàng.
Cơ sở lý thuyết và định nghĩa
Radiomics dựa trên giả định rằng có mối quan hệ giữa hình ảnh y khoa và sinh học mô học, từ đó trích xuất thông tin định lượng có giá trị chẩn đoán, tiên lượng hoặc phản hồi điều trị. Để thực hiện điều này, cần một chuỗi quy trình xử lý khắt khe và thống nhất để biến hình ảnh thô thành dữ liệu có thể sử dụng trong mô hình phân tích.
Quy trình cơ bản trong radiomics bao gồm:
- Tiền xử lý hình ảnh: hiệu chỉnh độ phân giải, chuẩn hóa cường độ, lọc nhiễu.
- Phân đoạn ROI: xác định vùng mô bệnh hoặc cơ quan quan tâm.
- Trích xuất đặc trưng: tạo tập đặc trưng từ ROI theo các nhóm: hình học, cường độ, kết cấu, biến đổi miền.
- Lựa chọn đặc trưng: loại bỏ nhiễu, giảm số chiều.
- Xây dựng mô hình: sử dụng các thuật toán học máy để đưa ra dự đoán hoặc phân loại.
Radiomics không chỉ đơn thuần là “số hóa” hình ảnh, mà là quá trình khai phá dữ liệu có cấu trúc phức tạp và liên quan sinh học chặt chẽ, đòi hỏi kiến thức đa ngành về y học, tin học, thống kê và trí tuệ nhân tạo.
Phân loại đặc trưng trong Radiomics
Các đặc trưng radiomics được chia thành nhiều nhóm, mỗi nhóm phản ánh một khía cạnh riêng biệt của mô bệnh hoặc cấu trúc hình ảnh. Mỗi đặc trưng được định nghĩa bằng một phương pháp toán học cụ thể, tạo nên hàng trăm thông số khác nhau từ một ROI duy nhất.
Các nhóm đặc trưng chính gồm:
- Hình học: mô tả kích thước, thể tích, chu vi, độ phức tạp bề mặt ROI.
- Cường độ (first-order): thống kê đơn giản như trung bình, độ lệch chuẩn, độ lệch phân phối từ histogram cường độ pixel.
- Kết cấu (texture): khai thác mô hình phân bố và mối quan hệ không gian giữa các voxel, thông qua ma trận GLCM, GLRLM, GLSZM, NGTDM.
- Biến đổi miền: sử dụng wavelet hoặc bộ lọc LoG để phân tích ảnh ở nhiều tần số và thang đo khác nhau.
Ví dụ về một số đặc trưng cụ thể và công thức liên quan:
Bảng dưới đây minh họa các nhóm đặc trưng và mục tiêu phân tích:
Nhóm đặc trưng | Ví dụ | Thông tin phản ánh |
---|---|---|
Hình học | Volume, Sphericity, Compactness | Kích thước, hình dạng ROI |
Cường độ | Mean, Skewness, Kurtosis | Phân bố cường độ voxel |
Kết cấu | GLCM Entropy, Homogeneity | Đặc tính kết cấu vi mô |
Biến đổi miền | Wavelet-HHL, LoG sigma=2 | Thông tin đa tần và biên cạnh |
Ứng dụng lâm sàng của Radiomics
Radiomics đang được ứng dụng và thử nghiệm trong nhiều lĩnh vực y học, nổi bật nhất là trong ung thư học. Các đặc trưng hình ảnh có thể giúp phân loại tổn thương, đánh giá khả năng đáp ứng điều trị và tiên lượng nguy cơ tái phát.
Một số ứng dụng lâm sàng điển hình:
- Phân biệt khối u lành và ác trên hình ảnh CT ngực.
- Dự đoán đột biến gen EGFR từ hình ảnh CT trong ung thư phổi không tế bào nhỏ [Radiology 2017].
- Tiên lượng thời gian sống còn của bệnh nhân glioblastoma dựa trên đặc trưng MRI và kết cấu GLCM.
- Phân tầng nguy cơ nhồi máu não tái phát qua đặc trưng DTI não.
Một nghiên cứu từ Lancet Oncology (2019) đã chỉ ra rằng mô hình radiomics kết hợp với lâm sàng cải thiện đáng kể độ chính xác trong dự đoán đáp ứng điều trị hóa-xạ trị ở ung thư cổ tử cung, từ AUC 0.72 lên 0.84 khi dùng mô hình tích hợp.
Radiogenomics: Kết hợp hình ảnh và gen học
Radiogenomics là một lĩnh vực kết hợp giữa phân tích hình ảnh y khoa (radiomics) và dữ liệu gen học (genomics) nhằm khám phá mối liên hệ giữa đặc trưng hình ảnh và đột biến gen, biểu hiện gen, hoặc phân nhóm phân tử. Mục tiêu là xây dựng mô hình phi xâm lấn có thể dự đoán đặc điểm sinh học của khối u, thay thế hoặc bổ trợ cho sinh thiết mô.
Một trong những ví dụ điển hình là khả năng dự đoán đột biến EGFR trong ung thư phổi không tế bào nhỏ (NSCLC) dựa trên đặc trưng kết cấu từ ảnh CT ngực. Các nghiên cứu đã phát hiện ra rằng các đặc trưng như GLCM entropy, skewness hoặc edge sharpness có mối liên hệ thống kê với các biến đổi gen EGFR, ALK và KRAS. Điều này mở ra triển vọng sử dụng radiogenomics để xác định liệu pháp nhắm trúng đích mà không cần lấy mô bệnh.
Bảng dưới đây minh họa một số cặp tương ứng đặc trưng hình ảnh và đặc điểm gen học trong các nghiên cứu:
Bệnh lý | Đặc trưng hình ảnh | Gen liên quan | Nguồn tham khảo |
---|---|---|---|
Ung thư phổi NSCLC | CT GLCM Entropy | EGFR | Radiology 2017 |
Glioblastoma | MRI Texture Uniformity | IDH1, MGMT | PMID: 26446091 |
Chuẩn hóa và tái lập trong Radiomics
Một vấn đề nghiêm trọng trong radiomics là tính tái lập (reproducibility) và khả năng tổng quát hóa mô hình giữa các trung tâm khác nhau. Các yếu tố như sự khác biệt về thiết bị, giao thức chụp, phần mềm xử lý, và kỹ thuật phân đoạn đều ảnh hưởng đến đặc trưng được trích xuất.
Để khắc phục, cộng đồng nghiên cứu đã đưa ra nhiều sáng kiến chuẩn hóa, tiêu biểu như:
- Image Biomarker Standardisation Initiative (IBSI): thiết lập định nghĩa toán học và quy trình chuẩn trích xuất đặc trưng.
- PyRadiomics: thư viện mã nguồn mở tuân thủ IBSI, được tích hợp vào nhiều nền tảng như 3D Slicer.
- Các nghiên cứu đa trung tâm (multi-center studies): sử dụng dữ liệu từ nhiều bệnh viện, scanner và điều kiện khác nhau để kiểm nghiệm độ ổn định mô hình.
Bảng dưới đây tổng hợp các yếu tố ảnh hưởng và giải pháp chuẩn hóa tương ứng:
Yếu tố | Ảnh hưởng | Biện pháp khắc phục |
---|---|---|
Loại máy chụp (CT, MRI) | Khác biệt về độ phân giải, contrast | Resampling, normalization |
Thuật toán phân đoạn | Sai lệch ROI, rò rỉ vùng | Chuẩn hóa mask hoặc dùng deep learning segmentation |
Phần mềm xử lý | Không đồng nhất định nghĩa đặc trưng | Sử dụng thư viện tuân chuẩn IBSI |
Radiomics và trí tuệ nhân tạo (AI)
Radiomics và trí tuệ nhân tạo có mối quan hệ bổ sung lẫn nhau. Radiomics cung cấp các đặc trưng định lượng có thể sử dụng làm đầu vào cho các mô hình học máy (machine learning) và học sâu (deep learning) để phát hiện mẫu, phân loại, và dự đoán.
Các thuật toán học máy phổ biến trong radiomics:
- Random Forest
- Support Vector Machine (SVM)
- Gradient Boosting (XGBoost, LightGBM)
- Logistic Regression với lựa chọn đặc trưng LASSO
Mỗi thuật toán có điểm mạnh khác nhau: ví dụ, Random Forest hiệu quả với dữ liệu không tuyến tính, trong khi SVM phù hợp với không gian đặc trưng cao chiều.
Kết hợp radiomics với deep learning tạo nên mô hình hybrid: deep learning xử lý ảnh thô, còn radiomics cung cấp đặc trưng toán học bổ sung, nâng cao khả năng giải thích và hiệu suất dự đoán. Điều này đặc biệt quan trọng trong môi trường lâm sàng yêu cầu mô hình “có thể giải thích được” (explainable AI).
Hạn chế và thách thức hiện tại
Dù có tiềm năng lớn, radiomics vẫn còn đối mặt với nhiều hạn chế:
- Số lượng đặc trưng lớn dễ gây overfitting, đặc biệt khi dữ liệu huấn luyện ít.
- Độ nhạy cao với thay đổi kỹ thuật chụp và tiền xử lý ảnh.
- Thiếu quy định pháp lý rõ ràng cho mô hình lâm sàng dựa trên radiomics.
- Cần thời gian và nhân lực để phân đoạn ROI thủ công hoặc bán tự động.
Việc cải thiện các công cụ phân đoạn tự động, mở rộng tập dữ liệu đa dạng và tích hợp dữ liệu lâm sàng sẽ là bước quan trọng để radiomics trở thành một phần tiêu chuẩn trong quy trình chăm sóc y tế chính xác.
Triển vọng và xu hướng tương lai
Tương lai của radiomics nằm ở tích hợp dữ liệu đa tầng (multi-omics): kết hợp hình ảnh, gen học, proteomics, lâm sàng và môi trường sống để xây dựng mô hình toàn diện hơn. Các nghiên cứu gần đây đang đi theo hướng phát triển mô hình dự đoán đa phương thức (multimodal predictive models).
Một số xu hướng nổi bật:
- Phân tích dữ liệu real-time từ hệ thống PACS bệnh viện
- Phát triển mô hình federated learning không cần chia sẻ dữ liệu cá nhân
- Sử dụng AI để phân đoạn tự động ROI trên dữ liệu lớn
- Đưa radiomics vào hệ thống hỗ trợ quyết định lâm sàng (CDSS)
Với sự đầu tư từ cả ngành y tế và công nghệ, radiomics có khả năng trở thành nền tảng cơ bản trong y học chính xác, hỗ trợ ra quyết định nhanh, khách quan và dữ liệu hóa tại mọi giai đoạn của quy trình điều trị.
Tài liệu tham khảo
- Lambin, P., et al. (2012). “Radiomics: extracting more information from medical images using advanced feature analysis.” European Journal of Cancer.
- Gillies, R. J., Kinahan, P. E., & Hricak, H. (2016). “Radiomics: Images Are More than Pictures, They Are Data.” Radiology. Radiology Journal.
- Parmar, C., et al. (2015). “Radiomic feature clusters and prognostic signatures specific for Lung and Head & Neck cancer.” Scientific Reports.
- van Griethuysen, J. J. M., et al. (2017). “Computational radiomics system to decode the radiographic phenotype.” Cancer Research. PyRadiomics Docs.
- Zwanenburg, A., et al. (2020). “The Image Biomarker Standardisation Initiative.” Radiology. IBSI.
- Yip, S. S. F., & Aerts, H. J. W. L. (2016). “Applications and limitations of radiomics.” Physics in Medicine and Biology.
- Kickingereder, P., et al. (2016). “Radiogenomics of Glioblastoma: Machine Learning–Based Classification of Molecular Characteristics by Using Multiparametric and Multiregional MR Imaging Features.” Radiology.
Các bài báo, nghiên cứu, công bố khoa học về chủ đề radiomics:
- 1
- 2
- 3
- 4
- 5
- 6
- 10