Proteomic là gì? Các bài báo nghiên cứu khoa học liên quan
Proteomic là ngành khoa học nghiên cứu toàn bộ tập protein (proteome) trong tế bào, mô hoặc cơ thể tại một thời điểm xác định, bao gồm mọi biến thể và biến đổi hậu tổng hợp. Proteomic tập trung vào xác định danh tính, định lượng, cấu trúc, tương tác và chức năng của protein nhằm hiểu cơ chế sinh học, phát hiện dấu ấn sinh học và phát triển liệu pháp mới.
Định nghĩa và khái niệm cơ bản
Proteomic là ngành khoa học nghiên cứu toàn bộ tập hợp protein (proteome) hiện diện trong một tế bào, mô hoặc cơ thể tại một thời điểm nhất định, bao gồm mọi biến thể và biến đổi hậu tổng hợp (PTM). Khái niệm này mở rộng từ genomics, chuyển trọng tâm từ gene sang sản phẩm cuối cùng của gene là protein, vốn trực tiếp thực hiện hầu hết chức năng sinh học.
Proteome không chỉ đơn thuần là danh sách protein mà còn bao gồm nồng độ, vị trí, cấu trúc ba chiều, tương tác và hoạt tính sinh học của từng protein. Sự thay đổi proteome theo điều kiện sinh lý hoặc bệnh lý cung cấp thông tin quan trọng để hiểu cơ chế bệnh, phát hiện dấu ấn sinh học (biomarker) và phát triển liệu pháp mới.
Cỡ proteome người ước tính khoảng protein cơ bản, nhưng khi tính đến các isoform và biến đổi hậu tổng hợp, con số này có thể lên tới hàng trăm ngàn. Độ phức tạp này đòi hỏi các kỹ thuật phân tích cao cấp, từ tách chiết protein đến phân tích khối phổ và xử lý dữ liệu bioinformatics.
Lịch sử và phát triển
Thuật ngữ “proteome” lần đầu xuất hiện vào năm 1994 do Marc Wilkins đặt ra, phản ánh ý tưởng về bộ hoàn chỉnh protein tương ứng với genome. Những năm cuối thập niên 1980, phương pháp điện di hai chiều (2D-PAGE) cho phép tách và hình ảnh hóa hàng ngàn protein trên gel, mở ra kỷ nguyên proteomic đầu tiên.
Giữa thập niên 1990, sự ra đời của khối phổ tandem (MS/MS) đánh dấu bước tiến đột phá, cho phép xác định trình tự peptide và định lượng protein với độ nhạy cao và độ chính xác cải thiện. Phương pháp phân tích phổ khối kết hợp sắc ký chất lỏng (LC-MS/MS) trở thành tiêu chuẩn vàng cho nghiên cứu proteomic.
- 1987: 2D-PAGE phân tách protein theo pI và khối lượng.
- 1994: Đề xuất khái niệm proteome và proteomics.
- 1995–2000: Phát triển MS/MS và LC-MS/MS.
- 2001: Thành lập Human Proteome Organization (HUPO).
HUPO ra đời năm 2001 với mục tiêu phối hợp bản đồ proteome người, chuẩn hóa quy trình và chia sẻ dữ liệu. Các cột mốc quan trọng tiếp theo bao gồm dự án bản đồ proteome chuột, proteome mô tim và proteome ung thư, đóng góp dữ liệu công khai qua ProteomeXchange.
Quy trình chuẩn bị mẫu
Thu thập mẫu mô hoặc tế bào, duy trì nhiệt độ thấp (0–4 °C) và điều kiện pH trung tính, nhằm bảo toàn cấu trúc và hoạt tính protein. Thêm chất ức chế protease và phosphatase vào đệm ly giải để ngăn chặn phân giải và khử phosphate tự phát.
Làm tan mẫu bằng đệm có chứa urea hoặc guanidine HCl cho protein hòa tan hoàn toàn. Tiếp theo, siêu âm hoặc nghiền mô lạnh để phá vỡ màng tế bào, ly giải hoàn toàn protein trong dung dịch.
- Chiết tách thô: ly tâm để loại bỏ mảnh vụn tế bào.
- Làm sạch protein: sắc ký pha rắn (SPE) hoặc dialyze để loại muối và tạp chất nhỏ.
- Phân đoạn protein: cắt bằng trypsin tạo peptide dài 7–20 amino acid.
Bước | Phương pháp | Mục đích |
---|---|---|
Ly giải tế bào | Urea 8 M + protease inhibitor | Hòa tan protein, bảo toàn PTM |
Lọc tạp chất | SPE hoặc dialysis | Loại muối, lipid, nucleic acid |
Digestion | Trypsin, 37 °C, 4–16 h | Tạo peptide phân tích MS |
Chuẩn hóa nồng độ peptide trước khi nạp vào hệ LC-MS/MS bằng phương pháp UV absorbance hoặc colorimetric assay, đảm bảo dữ liệu định lượng tái lập giữa các mẫu.
Kỹ thuật phân tích
2D-Gel Electrophoresis (2D-PAGE) tách protein theo điểm đẳng điện (pI) trên gel pH gradient, sau đó tách theo khối lượng phân tử trong pha thứ hai. Gel nhuộm Coomassie hoặc bạc giúp định vị hàng nghìn điểm protein, thuận tiện cho chọn mẫu cắt gel và phân tích MS.
LC-MS/MS là kỹ thuật chủ đạo, bước đầu peptide tách trên cột nanoLC, tiếp đó ion hóa bằng electrospray (ESI) và phân tích ở hai mức: MS1 đo m/z của peptide, MS2 phân mảnh đưa ra phổ “fingerprint” để xác định trình tự qua database search.
- Data-Dependent Acquisition (DDA): tự động chọn ion mạnh nhất để phân mảnh.
- Data-Independent Acquisition (DIA/SWATH): phân đoạn quang phổ liên tục, tăng độ bao phủ proteome.
- Label-Free Quantification: đo độ sáng ion, so sánh cường độ giữa mẫu.
Kỹ thuật TMT/iTRAQ gắn nhãn đẳng trọng (isobaric) lên peptide, phối hợp nhiều mẫu trong một lần phân tích, tăng throughput và giảm sai số kỹ thuật. Phổ reporter ion sau MS2 cho kết quả định lượng tương đối chính xác.
Phân tích dữ liệu và bioinformatics
Quá trình xử lý dữ liệu proteomic bắt đầu bằng việc chuyển đổi phổ MS/MS thành trình tự peptide bằng phần mềm như Mascot, Sequest hoặc Andromeda. Kết quả search trả về danh sách peptide khớp với protein tham chiếu, kèm theo điểm tin cậy (score) và mức FDR (false discovery rate) kiểm soát sai lệch giả.
Định lượng protein tương đối có thể thực hiện theo phương pháp label-free hoặc gắn nhãn đẳng trọng (TMT/iTRAQ). Label-free so sánh cường độ ion giữa các mẫu bằng thuật toán MaxLFQ, trong khi TMT/iTRAQ sử dụng phổ reporter ion để so sánh mẫu đồng thời, giảm thiểu biến thiên kỹ thuật.
- Database search: xác định peptide/protein với FDR ≤1%.
- Normalized quantification: MaxLFQ, iBAQ cho label-free; tỷ lệ reporter ion cho TMT.
- Phân tích thống kê: ANOVA, t-test hoặc phương pháp đa biến (PCA, PLS-DA) để phát hiện protein khác biệt.
Mạng tương tác protein (PPI) được xây dựng dựa trên dữ liệu từ STRING hoặc BioGRID, giúp xác định các module chức năng và đường dẫn tín hiệu. Enrichment analysis qua GO (Gene Ontology) và KEGG cho phép làm sáng tỏ cơ chế sinh học liên quan đến tập protein có biến động độ biểu hiện.
Ứng dụng trong sinh học và y học
Proteomic khám phá biomarker chẩn đoán sớm ung thư thông qua phân tích mẫu máu hoặc mô bệnh lý. Ví dụ, biệt hóa biểu hiện protein trong huyết thanh giữa bệnh nhân ung thư gan và người lành, xác định các protein ABCG2, AFP với độ nhạy và đặc hiệu cao.
Trong nghiên cứu bệnh lý thần kinh, phân tích proteome não chuột mô hình Alzheimer tiết lộ tăng phospho-tau và giảm Synaptophysin. Thông tin này hỗ trợ thiết kế thuốc nhắm vào quá trình phosphoryl hóa tau và bảo tồn synapse.
- Phân tích PTM: phosphoproteomics để theo dõi phosphoryl hóa tyrosine/serine.
- Glycoproteomics: xác định glycosylation sites quan trọng trong tín hiệu tế bào.
- Ubiquitinomics: đánh giá ubiquitination liên quan đến thoái hóa protein.
Ứng dụng proteomic trong nghiên cứu vi sinh vật giúp xác định protein bề mặt vi khuẩn, phục vụ phát triển vaccine. Ví dụ, proteome Helicobacter pylori tiết lộ protein BabA và VacA, là mục tiêu cho vaccine phòng loét dạ dày.
Ứng dụng trong dược phẩm và chăm sóc sức khỏe
Proteomic support phát triển drug target bằng cách phân tích interaction proteome-wide. Screening kháng thể đơn dòng trên nền tảng protein microarray xác định mục tiêu chất ức chế kinases hoặc GPCR với độ đặc hiệu cao.
Trong precision medicine, hồ sơ proteomic bệnh nhân dùng để phân tầng nguy cơ và tối ưu phác đồ điều trị. Ví dụ, phân tích proteome mô ung thư vú xác định signature protein HER2, ER và PR, quyết định lựa chọn liệu pháp nhắm trúng đích trastuzumab hoặc hormone therapy.
Ứng dụng | Công nghệ | Lợi ích |
---|---|---|
Drug target discovery | Protein microarray | Tiết kiệm thời gian, độ chính xác cao |
Therapeutic monitoring | LC-MS/MS label-free | Theo dõi nồng độ thuốc và protein đích |
Personalized therapy | TMT/iTRAQ | So sánh mẫu bệnh nhân, tối ưu phác đồ |
Proteomic cũng hỗ trợ đánh giá dược động học/pharmacodynamics bằng cách theo dõi tương tác thuốc–protein và biến đổi PTM sau điều trị, cải thiện tính an toàn và hiệu quả lâm sàng.
Thách thức kỹ thuật
Proteome có biên độ biểu hiện rộng, có thể lên đến lần giữa protein giàu và hiếm, gây khó khăn trong phát hiện low-abundance protein. Hơn nữa, PTM hiếm như ubiquitination hoặc glycosylation phức tạp đòi hỏi kỹ thuật enrich đặc hiệu và khối phổ độ phân giải cao.
Chuẩn hóa quy trình mẫu, bao gồm ly giải, digestion và nạp mẫu vào MS, rất quan trọng để giảm biến thiên kỹ thuật. Hệ thống nano-LC-MS/MS cần duy trì độ ổn định cao về áp suất, gradient và ion source để đảm bảo dữ liệu tái lập.
- Biên độ động: khó phát hiện protein <1 ng/mL trong mẫu huyết tương.
- Reproducibility: yêu cầu QC liên tục với peptide chuẩn và run blanks.
- Data complexity: hàng trăm nghìn phổ cần xử lý, đòi hỏi tính toán cao và lưu trữ lớn.
Hướng nghiên cứu tương lai
Single-cell proteomics đang nổi lên với kỹ thuật nanoPOTS và SCoPE-MS, cho phép phân tích proteome ở cấp độ tế bào đơn, mở ra hiểu biết về heterogeneity tế bào trong mô ung thư hoặc hệ miễn dịch.
Imaging mass spectrometry (MALDI-IMS, DESI-MS) kết hợp spatial proteomics, cung cấp bản đồ phân bố protein in situ trong mô. Phương pháp này hữu ích trong nghiên cứu tổ chức mô và vi mô môi trường vi mô bệnh lý.
- Multi-omics integration: kết hợp proteomic, transcriptomic và metabolomic để xây dựng mô hình hệ thống sinh học.
- Real-time MS: phát triển khối phổ có khả năng phân tích trực tiếp mẫu sinh học lâm sàng mà không cần chuẩn bị phức tạp.
- AI và machine learning: áp dụng deep learning cho phân tích phổ và dự đoán cấu trúc/chức năng protein mới.
Phát triển cộng đồng dữ liệu mở qua ProteomeXchange và PRIDE tiếp tục thúc đẩy chia sẻ dữ liệu và chuẩn hóa quy trình, tăng tốc tiến trình nghiên cứu proteomic toàn cầu.
Tài liệu tham khảo
- Wilkins, M. R. et al. Progress with proteome projects: why all proteins expressed by a genome should be identified and how to do it. Biotechnol. Genet. Eng. Rev. 1996, 13, 19–50.
- Eng, J. K.; McCormack, A. L.; Yates, J. R. An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database. J. Am. Soc. Mass Spectrom. 1994, 5(11), 976–989. https://pubmed.ncbi.nlm.nih.gov/12469539/
- Aebersold, R.; Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature 2016, 537, 347–355. https://doi.org/10.1038/nature19949
- Vizcaíno, J. A. et al. ProteomeXchange provides globally coordinated proteomics data submission and dissemination. Nat. Biotechnol. 2014, 32, 223–226. https://doi.org/10.1038/nbt.2839
- Fraser, K. et al. Single-cell proteomics: progress and future opportunities. Nat. Rev. Genet. 2020, 21, 408–421.
- Gode, C. J.; Muddiman, D. C. Time-of-flight mass spectrometry: novel applications. Mass Spectrom. Rev. 2021, 40(2), 148–176.
- Thermo Fisher Scientific. What is Proteomics? https://www.thermofisher.com/
- Human Proteome Organization (HUPO). https://www.hupo.org/
Các bài báo, nghiên cứu, công bố khoa học về chủ đề proteomic:
- 1
- 2
- 3
- 4
- 5
- 6
- 10