Chuỗi Quy Trình In Silico Để Xác Định Các Kháng Nguyên Đặc Hiệu Khối U Đối Với Liệu Pháp Miễn Dịch Ung Thư Sử Dụng Dữ Liệu Giải Mã Exome

Springer Science and Business Media LLC - Tập 3 - Trang 130-137 - 2022
Diego Morazán-Fernández1, Javier Mora2, Jose Arturo Molina-Mora2
1Caja Costarricense de Seguro Social, San José, Costa Rica
2Centro de Investigación de Enfermedades Tropicales, Centro de Investigación en Cirugía y Cáncer, and Facultad de Microbiología, Universidad de Costa Rica, San José, Costa Rica

Tóm tắt

Các kháng nguyên đặc hiệu cho khối u hay neoantigen là các peptide chỉ được biểu hiện trong các tế bào ung thư và không có ở các tế bào khỏe mạnh. Một số phân tử này có thể kích thích phản ứng miễn dịch, và do đó, việc sử dụng chúng trong các chiến lược miễn dịch dựa trên vắc xin ung thư đã được khám phá một cách rộng rãi. Các nghiên cứu dựa trên những phương pháp này đã được khởi xướng bởi những công nghệ giải trình tự DNA công suất lớn hiện nay. Tuy nhiên, chưa có một quy trình bioinformatics phổ quát hoặc đơn giản để phát hiện neoantigen sử dụng dữ liệu giải trình tự DNA. Do đó, chúng tôi đề xuất một quy trình bioinformatics để phát hiện các kháng nguyên đặc hiệu cho khối u liên quan đến các biến thể nucleotid đơn (SNV) hoặc "đột biến" trong các mô khối u. Để thực hiện điều này, chúng tôi đã sử dụng dữ liệu công khai có sẵn để xây dựng mô hình của mình, bao gồm dữ liệu giải trình tự exome từ ung thư đại trực tràng và các tế bào khỏe mạnh thu được từ một trường hợp duy nhất, cũng như các allele kháng nguyên bạch cầu người (HLA) lớp I phổ biến trong một quần thể cụ thể. Dữ liệu HLA từ quần thể Thung lũng Trung tâm Costa Rica đã được chọn làm ví dụ. Chiến lược bao gồm ba bước chính: (1) tiền xử lý dữ liệu giải trình tự; (2) phân tích gọi biến thể để phát hiện các SNV đặc hiệu cho khối u so với mô khỏe mạnh; và (3) dự đoán và đặc trưng hóa các peptide (các đoạn protein, các kháng nguyên đặc hiệu cho khối u) được tạo ra từ các biến thể, trong bối cảnh sự tương hợp của chúng với các allele phổ biến của quần thể được chọn. Trong dữ liệu mô hình của chúng tôi, chúng tôi đã phát hiện 28 SNV không im lặng, có mặt trong 17 gen trên nhiễm sắc thể một. Quy trình đã tạo ra 23 peptide gắn kết mạnh được phát sinh từ các SNV cho các allele HLA lớp I phổ biến của quần thể Costa Rica. Mặc dù các phân tích đã được thực hiện như một ví dụ để áp dụng chuỗi quy trình, theo kiến thức của chúng tôi, đây là nghiên cứu đầu tiên về một vắc xin ung thư in silico sử dụng dữ liệu giải trình tự DNA trong bối cảnh của các allele HLA. Kết luận cho thấy rằng quy trình chuẩn hóa không chỉ có khả năng xác định neoantigen trong một bối cảnh cụ thể mà còn cung cấp một chuỗi quy trình hoàn chỉnh cho việc thiết kế vắc xin ung thư với các thực hành bioinformatics tốt nhất.

Từ khóa

#kháng nguyên đặc hiệu khối u #neoantigen #liệu pháp miễn dịch #vắc xin ung thư #biến thể nucleotid đơn #dữ liệu giải trình tự #bạch cầu người #HLA #exome sequencing

Tài liệu tham khảo

Almawi WY, Nemr R, Finan RR et al (2022) HLA-A, -B, -C, -DRB1 and -DQB1 allele and haplotype frequencies in Lebanese and their relatedness to neighboring and distant populations. BMC Genom 23:1–10. https://doi.org/10.1186/S12864-022-08682-7/TABLES/4 Andries V, Vandepoele K, Staes K et al (2015) NBPF1, a tumor suppressor candidate in neuroblastoma, exerts growth inhibitory effects by inducing a G1 cell cycle arrest. BMC Cancer. https://doi.org/10.1186/S12885-015-1408-5 Araz O, Ucar EY, Meral M et al (2015) Frequency of Class I and II HLA alleles in patients with lung cancer according to chemotherapy response and 5-year survival. Clin Respir J 9:297–304. https://doi.org/10.1111/CRJ.12143 Arrieta-Bolaños E, Maldonado-Torres H, Dimitriu O et al (2011) HLA-A, -B, -C, -DQB1, and -DRB1,3,4,5 allele and haplotype frequencies in the Costa Rica Central Valley Population and its relationship to worldwide populations. Hum Immunol 72:80–86. https://doi.org/10.1016/J.HUMIMM.2010.10.005 Arrieta-Bolaños E, Madrigal-Sánchez JJ, Stein JE et al (2018) High-resolution HLA allele and haplotype frequencies in majority and minority populations of Costa Rica and Nicaragua: differential admixture proportions in neighboring countries. HLA 91:514–529. https://doi.org/10.1111/TAN.13280 Bae JM, Kim JH, Kang GH (2016) Molecular subtypes of colorectal cancer and their clinicopathologic features, with an emphasis on the serrated neoplasia pathway. Arch Pathol Lab Med 140:406–412. https://doi.org/10.5858/ARPA.2015-0310-RA Barquera R, Collen E, Di D et al (2020) Binding affinities of 438 HLA proteins to complete proteomes of seven pandemic viruses and distributions of strongest and weakest HLA peptide binders in populations worldwide. HLA 96:277–298. https://doi.org/10.1111/tan.13956 Blankenberg D, Gordon A, Von Kuster G et al (2010) Manipulation of FASTQ data with galaxy. Bioinformatics 26:1783–1785. https://doi.org/10.1093/bioinformatics/btq281 Bodmer WF, Browning MJ, Krausa P et al (1993) Tumor escape from immune response by variation in HLA expression and other mechanisms. Ann N Y Acad Sci 690:42–49. https://doi.org/10.1111/j.1749-6632.1993.tb43994.x Buonaguro L, Tagliamonte M (2020) Selecting target antigens for cancer vaccine development. Vaccines 8:1–14. https://doi.org/10.3390/VACCINES8040615 Chi C (2021) HLA allele imputation with multitask deep convolutional neural network. bioRxiv 2021.06.03.447012. https://doi.org/10.1101/2021.06.03.447012 Chisanga D, Keerthikumar S, Pathan M et al (2016) Colorectal cancer atlas: an integrative resource for genomic and proteomic annotations from colorectal cancer cell lines and tissues. Nucl Acids Res 44:D969–D974. https://doi.org/10.1093/NAR/GKV1097 Cingolani P, Patel VM, Coon M et al (2012a) Using Drosophila melanogaster as a model for genotoxic chemical mutational studies with a new program, SnpSift. Front Genet 3:1–9. https://doi.org/10.3389/fgene.2012.00035 Cingolani P, Platts A, Wang LL et al (2012b) A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3. Fly (austin) 6:80–92. https://doi.org/10.4161/fly.19695 Craig DJ, Bailey MM, Noe OB et al (2022) Subclonal landscape of cancer drives resistance to immune therapy. Cancer Treat Res Commun. https://doi.org/10.1016/J.CTARC.2021.100507 Ding L, Wendl MC, McMichael JF, Raphael BJ (2014) Expanding the computational toolbox for mining cancer genomes. Nat Rev Genet 15:556–570. https://doi.org/10.1038/nrg3767 Dyckhoff G, Herold-Mende C, Scherer S et al (2022) Human leucocyte antigens as prognostic markers in head and neck squamous cell carcinoma. Cancers 14:3828. https://doi.org/10.3390/CANCERS14153828 Emens LA, Ascierto PA, Darcy PK et al (2017) Cancer immunotherapy: opportunities and challenges in the rapidly evolving clinical landscape. Eur J Cancer 81:116–129. https://doi.org/10.1016/J.EJCA.2017.01.035 Fleri W, Paul S, Dhanda SK et al (2017) The immune epitope database and analysis resource in epitope discovery and synthetic vaccine design. Front Immunol. https://doi.org/10.3389/FIMMU.2017.00278 Gasteiger E, Hoogland C, Gattiker A et al (2005) Protein identification and analysis tools on the ExPASy server. In: Wlaker JM (ed) The proteomics protocols handbook. Human Press, London, pp 571–608 Giannakis M, Mu XJ, Shukla SA et al (2016) Genomic correlates of immune-cell infiltrates in colorectal carcinoma. Cell Rep 15:857–865. https://doi.org/10.1016/J.CELREP.2016.03.075 González-Galarza FF, Takeshita LYC, Santos EJM et al (2015) Allele frequency net 2015 update: new features for HLA epitopes, KIR and disease and HLA adverse drug reaction associations. Nucl Acids Res 43:D784. https://doi.org/10.1093/NAR/GKU1166 Hackl H, Charoentong P, Finotello F, Trajanoski Z (2016) Computational genomics tools for dissecting tumour–immune cell interactions. Nat Rev Genet 17:441–458. https://doi.org/10.1038/nrg.2016.67 Heather JM, Chain B (2016) The sequence of sequencers: the history of sequencing DNA. Genomics 107:1. https://doi.org/10.1016/J.YGENO.2015.11.003 Karasaki T, Nagayama K, Kuwano H et al (2017) An immunogram for the cancer-immunity cycle: towards personalized immunotherapy of lung cancer. J Thorac Oncol 12:791–803. https://doi.org/10.1016/J.JTHO.2017.01.005 Kato T, Matsuda T, Ikeda Y et al (2018) Effective screening of T cells recognizing neoantigens and construction of T-cell receptor-engineered T cells. Oncotarget 9:11009. https://doi.org/10.18632/ONCOTARGET.24232 Khor SS, Yang W, Kawashima M et al (2015) High-accuracy imputation for HLA class I and II genes based on high-resolution SNP data of population-specific references. Pharmacogenomics J 156(15):530–537. https://doi.org/10.1038/tpj.2015.4 Koboldt DC, Zhang Q, Larson DE et al (2012) VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing. Genome Res 22:568–576. https://doi.org/10.1101/gr.129684.111.568 Li H, Durbin R (2009) Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics 25:1754–1760. https://doi.org/10.1093/bioinformatics/btp324 Li H, Handsaker B, Wysoker A et al (2009) The sequence alignment/map format and SAMtools. Bioinformatics 25:2078–2079. https://doi.org/10.1093/bioinformatics/btp352 Li X, Zhou C, Chen K et al (2021) Benchmarking HLA genotyping and clarifying HLA impact on survival in tumor immunotherapy. Mol Oncol 15:1764. https://doi.org/10.1002/1878-0261.12895 Liao W, Li G, You Y et al (2018) Antitumor activity of Notch-1 inhibition in human colorectal carcinoma cells. Oncol Rep 39:1063. https://doi.org/10.3892/OR.2017.6176 Liu XS, Mardis ER (2017) Applications of immunogenomics to cancer. Cell 168:600–612. https://doi.org/10.1016/j.cell.2017.01.014 Liu ZK, Shang YK, Chen ZN, Bian H (2017) A three-caller pipeline for variant analysis of cancer whole-exome sequencing data. Mol Med Rep 15:2489–2494. https://doi.org/10.3892/MMR.2017.6336 Luo H, Ye H, Ng HW et al (2015) Understanding and predicting binding between human leukocyte antigens (HLAs) and peptides by network analysis. BMC Bioinform 16:1–9. https://doi.org/10.1186/1471-2105-16-S13-S9/FIGURES/5 Mette A, Morten B, Hadrup SR (2017) MuPeXI: prediction of neo-epitopes from tumor sequencing data. Cancer Immunol Immunother 66:1123–1130. https://doi.org/10.1007/s00262-017-2001-3 Molina-Mora JA (2022) Insights into the mutation T1117I in the spike and the lineage B.1.1.389 of SARS-CoV-2 circulating in Costa Rica. Gene Reports 27:1–9. https://doi.org/10.1016/J.GENREP.2022.101554 Morjaria S (2020) Driver mutations in oncogenesis. Int J Mol Immuno Oncol 6:1–3. https://doi.org/10.25259/ijmio_26_2020 Nielsen M, Andreatta M (2016) NetMHCpan-3.0: improved prediction of binding to MHC class I molecules integrating information from multiple receptor and peptide length datasets. Genome Med 8:1–9. https://doi.org/10.1186/s13073-016-0288-x Okonechnikov K, Conesa A, García-Alcalde F (2016) Qualimap 2: advanced multi-sample quality control for high-throughput sequencing data. Bioinformatics 32:292–294. https://doi.org/10.1093/bioinformatics/btv566 Palucka AK, Coussens LM (2016) The basis of oncoimmunology. Cell 164:1233–1247. https://doi.org/10.1016/j.cell.2016.01.049 Rizzo JM, Buck MJ (2012) Key principles and clinical applications of “next-generation”: DNA sequencing. Cancer Prev Res (phila) 5:887–900. https://doi.org/10.1158/1940-6207.CAPR-11-0432 Robinson J, Barker DJ, Georgiou X et al (2020) IPD-IMGT/HLA database. Nucl Acids Res 48:D948–D955. https://doi.org/10.1093/NAR/GKZ950 Shriver M, Stroka KM, Vitolo MI et al (2015) Loss of giant obscurins from breast epithelium promotes epithelial-to-mesenchymal transition, tumorigenicity and metastasis. Oncogene 34:4248–4259. https://doi.org/10.1038/ONC.2014.358 Sik Park H, Cho U, Im SY et al (2019) Loss of human leukocyte antigen class I expression is associated with poor prognosis in patients with advanced breast cancer. J Pathol Transl Med 53:75–85. https://doi.org/10.4132/jptm.2018.10.11 Spencer DH, Tyagi M, Vallania F et al (2014) Performance of common analysis methods for detecting low-frequency single nucleotide variants in targeted next-generation sequence data. J Mol Diagnost 16:75–88. https://doi.org/10.1016/j.jmoldx.2013.09.003 Spencer DH, Zhang B, Pfeifer J (2015) Single nucleotide variant detection using next generation sequencing. In: Kulkarni S, Pfeifer J (eds) Clinical genomics. Elsevier, London, pp 109–127 Su Z, Ning B, Fang H et al (2011) Next-generation sequencing and its application in molecular diagnostics. Expert Rev Mol Diagn 11:1–16. https://doi.org/10.1586/erm.11.3 Tang L, Zhang R, Zhang X, Yang L (2021) Personalized neoantigen-pulsed DC vaccines: advances in clinical applications. Front Oncol 11:2969. https://doi.org/10.3389/FONC.2021.701777/BIBTEX Wang K, Li M, Hakonarson H (2010) ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucl Acids Res 38:1–7. https://doi.org/10.1093/nar/gkq603 Wang Y, Liping GUO, Feng L et al (2018) Single nucleotide variant profiles of viable single circulating tumour cells reveal CTC behaviours in breast cancer. Oncol Rep 39:2147–2159. https://doi.org/10.3892/OR.2018.6325 Xu C (2018) A review of somatic single nucleotide variant calling algorithms for next-generation sequencing data. Comput Struct Biotechnol J 16:15–24. https://doi.org/10.1016/J.CSBJ.2018.01.003 Zhang Z, Lu M, Qin Y et al (2021) Neoantigen: a new breakthrough in tumor immunotherapy. Front Immunol 12:1297. https://doi.org/10.3389/FIMMU.2021.672356/BIBTEX