Radiomics là gì? Các bài báo nghiên cứu khoa học liên quan

Radiomics là lĩnh vực trích xuất và phân tích đặc trưng định lượng từ hình ảnh y khoa nhằm hỗ trợ chẩn đoán, tiên lượng và cá nhân hóa điều trị bệnh. Phương pháp này biến dữ liệu hình ảnh thành chỉ số sinh học số hóa, phản ánh đặc điểm mô học và gen học thông qua mô hình toán học và học máy.

Giới thiệu về Radiomics

Radiomics là một nhánh liên ngành trong y học hình ảnh, tập trung vào việc trích xuất, phân tích và mô hình hóa dữ liệu định lượng từ các hình ảnh y khoa như CT, MRI, PET. Khác với phương pháp đánh giá trực quan truyền thống, radiomics xem hình ảnh như một nguồn dữ liệu chứa đựng thông tin sinh học tiềm ẩn có thể chuyển hóa thành đặc trưng số học phục vụ chẩn đoán và tiên lượng bệnh.

Radiomics xuất phát từ nhu cầu khai thác triệt để dữ liệu hình ảnh mà bác sĩ không thể nhận biết bằng mắt thường. Ý tưởng cốt lõi là mỗi pixel/voxel không chỉ đại diện cho cấu trúc mô học mà còn mang các dấu hiệu phản ánh gen, protein, hoặc vi cấu trúc. Thay vì chỉ sử dụng hình ảnh như minh họa, radiomics biến hình ảnh thành một dạng “biomarker” định lượng có thể đưa vào mô hình học máy để hỗ trợ ra quyết định lâm sàng.

Cơ sở lý thuyết và định nghĩa

Radiomics dựa trên giả định rằng có mối quan hệ giữa hình ảnh y khoa và sinh học mô học, từ đó trích xuất thông tin định lượng có giá trị chẩn đoán, tiên lượng hoặc phản hồi điều trị. Để thực hiện điều này, cần một chuỗi quy trình xử lý khắt khe và thống nhất để biến hình ảnh thô thành dữ liệu có thể sử dụng trong mô hình phân tích.

Quy trình cơ bản trong radiomics bao gồm:

  • Tiền xử lý hình ảnh: hiệu chỉnh độ phân giải, chuẩn hóa cường độ, lọc nhiễu.
  • Phân đoạn ROI: xác định vùng mô bệnh hoặc cơ quan quan tâm.
  • Trích xuất đặc trưng: tạo tập đặc trưng từ ROI theo các nhóm: hình học, cường độ, kết cấu, biến đổi miền.
  • Lựa chọn đặc trưng: loại bỏ nhiễu, giảm số chiều.
  • Xây dựng mô hình: sử dụng các thuật toán học máy để đưa ra dự đoán hoặc phân loại.

 

Radiomics không chỉ đơn thuần là “số hóa” hình ảnh, mà là quá trình khai phá dữ liệu có cấu trúc phức tạp và liên quan sinh học chặt chẽ, đòi hỏi kiến thức đa ngành về y học, tin học, thống kê và trí tuệ nhân tạo.

Phân loại đặc trưng trong Radiomics

Các đặc trưng radiomics được chia thành nhiều nhóm, mỗi nhóm phản ánh một khía cạnh riêng biệt của mô bệnh hoặc cấu trúc hình ảnh. Mỗi đặc trưng được định nghĩa bằng một phương pháp toán học cụ thể, tạo nên hàng trăm thông số khác nhau từ một ROI duy nhất.

Các nhóm đặc trưng chính gồm:

  • Hình học: mô tả kích thước, thể tích, chu vi, độ phức tạp bề mặt ROI.
  • Cường độ (first-order): thống kê đơn giản như trung bình, độ lệch chuẩn, độ lệch phân phối từ histogram cường độ pixel.
  • Kết cấu (texture): khai thác mô hình phân bố và mối quan hệ không gian giữa các voxel, thông qua ma trận GLCM, GLRLM, GLSZM, NGTDM.
  • Biến đổi miền: sử dụng wavelet hoặc bộ lọc LoG để phân tích ảnh ở nhiều tần số và thang đo khác nhau.

 

Ví dụ về một số đặc trưng cụ thể và công thức liên quan: Entropy=pilog(pi)Entropy = -\sum p_i \log(p_i) GLCM Contrast=i,j(ij)2P(i,j)GLCM\ Contrast = \sum_{i,j} (i - j)^2 P(i,j) Mean Intensity=1Ni=1NIiMean\ Intensity = \frac{1}{N} \sum_{i=1}^N I_i

Bảng dưới đây minh họa các nhóm đặc trưng và mục tiêu phân tích:

Nhóm đặc trưngVí dụThông tin phản ánh
Hình họcVolume, Sphericity, CompactnessKích thước, hình dạng ROI
Cường độMean, Skewness, KurtosisPhân bố cường độ voxel
Kết cấuGLCM Entropy, HomogeneityĐặc tính kết cấu vi mô
Biến đổi miềnWavelet-HHL, LoG sigma=2Thông tin đa tần và biên cạnh

Ứng dụng lâm sàng của Radiomics

Radiomics đang được ứng dụng và thử nghiệm trong nhiều lĩnh vực y học, nổi bật nhất là trong ung thư học. Các đặc trưng hình ảnh có thể giúp phân loại tổn thương, đánh giá khả năng đáp ứng điều trị và tiên lượng nguy cơ tái phát.

Một số ứng dụng lâm sàng điển hình:

  • Phân biệt khối u lành và ác trên hình ảnh CT ngực.
  • Dự đoán đột biến gen EGFR từ hình ảnh CT trong ung thư phổi không tế bào nhỏ [Radiology 2017].
  • Tiên lượng thời gian sống còn của bệnh nhân glioblastoma dựa trên đặc trưng MRI và kết cấu GLCM.
  • Phân tầng nguy cơ nhồi máu não tái phát qua đặc trưng DTI não.

 

Một nghiên cứu từ Lancet Oncology (2019) đã chỉ ra rằng mô hình radiomics kết hợp với lâm sàng cải thiện đáng kể độ chính xác trong dự đoán đáp ứng điều trị hóa-xạ trị ở ung thư cổ tử cung, từ AUC 0.72 lên 0.84 khi dùng mô hình tích hợp.

Radiogenomics: Kết hợp hình ảnh và gen học

Radiogenomics là một lĩnh vực kết hợp giữa phân tích hình ảnh y khoa (radiomics) và dữ liệu gen học (genomics) nhằm khám phá mối liên hệ giữa đặc trưng hình ảnh và đột biến gen, biểu hiện gen, hoặc phân nhóm phân tử. Mục tiêu là xây dựng mô hình phi xâm lấn có thể dự đoán đặc điểm sinh học của khối u, thay thế hoặc bổ trợ cho sinh thiết mô.

Một trong những ví dụ điển hình là khả năng dự đoán đột biến EGFR trong ung thư phổi không tế bào nhỏ (NSCLC) dựa trên đặc trưng kết cấu từ ảnh CT ngực. Các nghiên cứu đã phát hiện ra rằng các đặc trưng như GLCM entropy, skewness hoặc edge sharpness có mối liên hệ thống kê với các biến đổi gen EGFR, ALK và KRAS. Điều này mở ra triển vọng sử dụng radiogenomics để xác định liệu pháp nhắm trúng đích mà không cần lấy mô bệnh.

Bảng dưới đây minh họa một số cặp tương ứng đặc trưng hình ảnh và đặc điểm gen học trong các nghiên cứu:

Bệnh lýĐặc trưng hình ảnhGen liên quanNguồn tham khảo
Ung thư phổi NSCLCCT GLCM EntropyEGFRRadiology 2017
GlioblastomaMRI Texture UniformityIDH1, MGMTPMID: 26446091

Chuẩn hóa và tái lập trong Radiomics

Một vấn đề nghiêm trọng trong radiomics là tính tái lập (reproducibility) và khả năng tổng quát hóa mô hình giữa các trung tâm khác nhau. Các yếu tố như sự khác biệt về thiết bị, giao thức chụp, phần mềm xử lý, và kỹ thuật phân đoạn đều ảnh hưởng đến đặc trưng được trích xuất.

Để khắc phục, cộng đồng nghiên cứu đã đưa ra nhiều sáng kiến chuẩn hóa, tiêu biểu như:

  • Image Biomarker Standardisation Initiative (IBSI): thiết lập định nghĩa toán học và quy trình chuẩn trích xuất đặc trưng.
  • PyRadiomics: thư viện mã nguồn mở tuân thủ IBSI, được tích hợp vào nhiều nền tảng như 3D Slicer.
  • Các nghiên cứu đa trung tâm (multi-center studies): sử dụng dữ liệu từ nhiều bệnh viện, scanner và điều kiện khác nhau để kiểm nghiệm độ ổn định mô hình.

 

Bảng dưới đây tổng hợp các yếu tố ảnh hưởng và giải pháp chuẩn hóa tương ứng:

Yếu tốẢnh hưởngBiện pháp khắc phục
Loại máy chụp (CT, MRI)Khác biệt về độ phân giải, contrastResampling, normalization
Thuật toán phân đoạnSai lệch ROI, rò rỉ vùngChuẩn hóa mask hoặc dùng deep learning segmentation
Phần mềm xử lýKhông đồng nhất định nghĩa đặc trưngSử dụng thư viện tuân chuẩn IBSI

Radiomics và trí tuệ nhân tạo (AI)

Radiomics và trí tuệ nhân tạo có mối quan hệ bổ sung lẫn nhau. Radiomics cung cấp các đặc trưng định lượng có thể sử dụng làm đầu vào cho các mô hình học máy (machine learning) và học sâu (deep learning) để phát hiện mẫu, phân loại, và dự đoán.

Các thuật toán học máy phổ biến trong radiomics:

  • Random Forest
  • Support Vector Machine (SVM)
  • Gradient Boosting (XGBoost, LightGBM)
  • Logistic Regression với lựa chọn đặc trưng LASSO

Mỗi thuật toán có điểm mạnh khác nhau: ví dụ, Random Forest hiệu quả với dữ liệu không tuyến tính, trong khi SVM phù hợp với không gian đặc trưng cao chiều.

 

Kết hợp radiomics với deep learning tạo nên mô hình hybrid: deep learning xử lý ảnh thô, còn radiomics cung cấp đặc trưng toán học bổ sung, nâng cao khả năng giải thích và hiệu suất dự đoán. Điều này đặc biệt quan trọng trong môi trường lâm sàng yêu cầu mô hình “có thể giải thích được” (explainable AI).

Hạn chế và thách thức hiện tại

Dù có tiềm năng lớn, radiomics vẫn còn đối mặt với nhiều hạn chế:

  • Số lượng đặc trưng lớn dễ gây overfitting, đặc biệt khi dữ liệu huấn luyện ít.
  • Độ nhạy cao với thay đổi kỹ thuật chụp và tiền xử lý ảnh.
  • Thiếu quy định pháp lý rõ ràng cho mô hình lâm sàng dựa trên radiomics.
  • Cần thời gian và nhân lực để phân đoạn ROI thủ công hoặc bán tự động.

 

Việc cải thiện các công cụ phân đoạn tự động, mở rộng tập dữ liệu đa dạng và tích hợp dữ liệu lâm sàng sẽ là bước quan trọng để radiomics trở thành một phần tiêu chuẩn trong quy trình chăm sóc y tế chính xác.

Triển vọng và xu hướng tương lai

Tương lai của radiomics nằm ở tích hợp dữ liệu đa tầng (multi-omics): kết hợp hình ảnh, gen học, proteomics, lâm sàng và môi trường sống để xây dựng mô hình toàn diện hơn. Các nghiên cứu gần đây đang đi theo hướng phát triển mô hình dự đoán đa phương thức (multimodal predictive models).

Một số xu hướng nổi bật:

  • Phân tích dữ liệu real-time từ hệ thống PACS bệnh viện
  • Phát triển mô hình federated learning không cần chia sẻ dữ liệu cá nhân
  • Sử dụng AI để phân đoạn tự động ROI trên dữ liệu lớn
  • Đưa radiomics vào hệ thống hỗ trợ quyết định lâm sàng (CDSS)

 

Với sự đầu tư từ cả ngành y tế và công nghệ, radiomics có khả năng trở thành nền tảng cơ bản trong y học chính xác, hỗ trợ ra quyết định nhanh, khách quan và dữ liệu hóa tại mọi giai đoạn của quy trình điều trị.

Tài liệu tham khảo

  1. Lambin, P., et al. (2012). “Radiomics: extracting more information from medical images using advanced feature analysis.” European Journal of Cancer.
  2. Gillies, R. J., Kinahan, P. E., & Hricak, H. (2016). “Radiomics: Images Are More than Pictures, They Are Data.” Radiology. Radiology Journal.
  3. Parmar, C., et al. (2015). “Radiomic feature clusters and prognostic signatures specific for Lung and Head & Neck cancer.” Scientific Reports.
  4. van Griethuysen, J. J. M., et al. (2017). “Computational radiomics system to decode the radiographic phenotype.” Cancer Research. PyRadiomics Docs.
  5. Zwanenburg, A., et al. (2020). “The Image Biomarker Standardisation Initiative.” Radiology. IBSI.
  6. Yip, S. S. F., & Aerts, H. J. W. L. (2016). “Applications and limitations of radiomics.” Physics in Medicine and Biology.
  7. Kickingereder, P., et al. (2016). “Radiogenomics of Glioblastoma: Machine Learning–Based Classification of Molecular Characteristics by Using Multiparametric and Multiregional MR Imaging Features.” Radiology.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề radiomics:

Radiomics: Images Are More than Pictures, They Are Data
Radiology - Tập 278 Số 2 - Trang 563-577 - 2016
Radiomics: Extracting more information from medical images using advanced feature analysis
European Journal of Cancer - Tập 48 Số 4 - Trang 441-446 - 2012
Hệ thống Radiomics Tính Toán để Giải Mã Phân Loại Radiographic Dịch bởi AI
Cancer Research - Tập 77 Số 21 - Trang e104-e107 - 2017
Tóm tắt Radiomics nhằm định lượng các đặc điểm biểu hiện trên hình ảnh y tế thông qua việc sử dụng các thuật toán tự động. Công nghệ trí tuệ nhân tạo (AI) trong radiomic, có thể dựa trên các thuật toán cứng đã được thiết kế hoặc các phương pháp học sâu, có thể được sử dụng để phát triển các dấu hiệu sinh học không xâm lấn dựa trên hình ảnh. Tuy nhiên...... hiện toàn bộ
Radiomics: the facts and the challenges of image analysis
Springer Science and Business Media LLC - - 2018
Machine Learning–Based Radiomics for Molecular Subtyping of Gliomas
Clinical Cancer Research - Tập 24 Số 18 - Trang 4429-4436 - 2018
Abstract Purpose: The new classification announced by the World Health Organization in 2016 recognized five molecular subtypes of diffuse gliomas based on isocitrate dehydrogenase (IDH) and 1p/19q genotypes in addition to histologic phenotypes. We aim to determine whether clinical MRI can stratify these molecular subtypes to benefit the diagnosis and...... hiện toàn bộ
Ý nghĩa thống kê: giá trị p, ngưỡng 0,05 và ứng dụng trong radiomics - lý do cho một cách tiếp cận bảo thủ Dịch bởi AI
Springer Science and Business Media LLC - - 2020
Tóm tắtTrong bài viết này, chúng tôi tóm tắt cuộc tranh luận chưa được giải quyết về giá trị p và sự phân chia của nó. Chúng tôi trình bày tuyên bố của Hiệp hội Thống kê Hoa Kỳ về việc chống lại việc lạm dụng ý nghĩa thống kê cũng như các đề xuất để từ bỏ việc sử dụng giá trị p và giảm ngưỡng ý nghĩa từ 0,05 xuố...... hiện toàn bộ
Identification of Non–Small Cell Lung Cancer Sensitive to Systemic Cancer Therapies Using Radiomics
Clinical Cancer Research - Tập 26 Số 9 - Trang 2151-2162 - 2020
Abstract Purpose: Using standard-of-care CT images obtained from patients with a diagnosis of non–small cell lung cancer (NSCLC), we defined radiomics signatures predicting the sensitivity of tumors to nivolumab, docetaxel, and gefitinib. ...... hiện toàn bộ
Tổng số: 1,557   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10