CardioTox net: một công cụ dự đoán chắc chắn cho việc chặn kênh hERG dựa trên các tổ hợp meta-feature học sâu

Springer Science and Business Media LLC - Tập 13 - Trang 1-13 - 2021
Abdul Karim1, Matthew Lee1, Thomas Balle2,3, Abdul Sattar4
1School of Information Communication Technology, Griffith University, Nathan, Brisbane, Australia
2Sydney Pharmacy School, Faculty of Medicine and Health, The University of Sydney, Sydney, Australia
3Brain and Mind Centre, The University of Sydney, Sydney, Australia
4Institute of Integrated and Intelligent Systems, Griffith University, Nathan, Brisbane, Australia

Tóm tắt

Việc chặn kênh gene liên quan đến ether-a-go-go (hERG) bằng các phân tử nhỏ là một mối quan tâm lớn trong quá trình phát triển thuốc trong ngành dược phẩm. Việc chặn các kênh hERG có thể gây ra khoảng QT kéo dài, điều này có thể dẫn đến độc tính tim mạch. Nhiều kỹ thuật in-silico, bao gồm các mô hình học sâu, được sử dụng rộng rãi để sàng lọc các phân tử nhỏ có độc tính liên quan đến hERG tiềm năng. Hầu hết các phương pháp học sâu đã đăng được sử dụng một loại đặc điểm duy nhất, điều này có thể hạn chế hiệu suất của chúng. Các phương pháp dựa trên nhiều loại đặc điểm hơn, chẳng hạn như DeepHIT, gặp khó khăn trong việc tổng hợp thông tin đã được trích xuất. DeepHIT cho thấy hiệu suất tốt hơn khi được đánh giá dựa trên một hoặc hai chỉ số độ chính xác như giá trị dự đoán âm (NPV) và độ nhạy (SEN), nhưng gặp khó khăn khi được đánh giá dựa trên các chỉ số khác như hệ số tương quan Matthew (MCC), độ chính xác (ACC), giá trị dự đoán dương (PPV) và tính đặc hiệu (SPE). Do đó, cần có một phương pháp có thể tổng hợp hiệu quả thông tin thu được từ các mô hình dựa trên các đại diện hóa học khác nhau và tăng cường dự đoán độc tính hERG trên một loạt các chỉ số hiệu suất. Trong bài báo này, chúng tôi đề xuất một khuôn khổ học sâu dựa trên đào tạo từng bước để dự đoán hoạt động chặn kênh hERG của các phân tử nhỏ. Phương pháp của chúng tôi sử dụng năm mô hình học sâu cơ sở riêng biệt với các đặc điểm cơ sở tương ứng và một mạng nơ-ron riêng biệt để kết hợp đầu ra của năm mô hình cơ sở. Bằng cách sử dụng ba bộ kiểm tra độc lập bên ngoài với hoạt động mạnh IC50 ở ngưỡng 10 µm, phương pháp của chúng tôi đạt hiệu suất tốt hơn cho sự kết hợp các chỉ số phân loại. Chúng tôi cũng điều tra việc tổng hợp hiệu quả thông tin hóa học đã được trích xuất để dự đoán hoạt động hERG chắc chắn. Tóm lại, CardioTox net có thể hoạt động như một công cụ mạnh mẽ để sàng lọc các phân tử nhỏ cho việc chặn kênh hERG trong các quy trình phát hiện thuốc và hoạt động tốt hơn so với các phương pháp đã được báo cáo trước đó trên một loạt các chỉ số phân loại.

Từ khóa

#hERG #độc tính tim mạch #chặn kênh ion #mô hình học sâu #sàng lọc thuốc #thông tin hóa học

Tài liệu tham khảo

Priest B, Bell IM, Garcia M (2008) Role of herg potassium channel assays in drug development. Channels 2(2):87–93 Redfern W, Carlsson L, Davis A, Lynch W, MacKenzie I, Palethorpe S, Siegl P, Strang I, Sullivan A, Wallis R et al (2003) Relationships between preclinical cardiac electrophysiology, clinical qt interval prolongation and torsade de pointes for a broad range of drugs: evidence for a provisional safety margin in drug development. Cardiovas Res 58(1):32–45 Aronov AM (2006) Common pharmacophores for uncharged human ether-a-go-go-related gene (herg) blockers. J Med Chem 49(23):6917–6921 Villoutreix BO, Taboureau O (2015) Computational investigations of herg channel blockers: new insights and current predictive models. Adv Drug Deliv Rev 86:72–82 Darpo B, Nebout T, Sager PT (2006) Clinical evaluation of qt/qtc prolongation and proarrhythmic potential for nonantiarrhythmic drugs: the international conference on harmonization of technical requirements for registration of pharmaceuticals for human use e14 guideline. J Clin Pharmacol 46(5):498–507 Cai C, Guo P, Zhou Y, Zhou J, Wang Q, Zhang F, Fang J, Cheng F (2019) Deep learning-based prediction of drug-induced cardiotoxicity. J Chem Inform Model 59(3):1073–1084 Doddareddy MR, Klaasse EC, IJzerman AP, Bender A (2010) Prospective validation of a comprehensive in silico herg model and its applications to commercial compound and drug databases. ChemMedChem 5(5):716–729 Lee H-M, Yu M-S, Kazmi SR, Oh SY, Rhee K-H, Bae M-A, Lee BH, Shin D-S, Oh K-S, Ceong H et al (2019) Computational determination of herg-related cardiotoxicity of drug candidates. BMC Bioinform 20(10):250 Cavalli A, Poluzzi E, De Ponti F, Recanatini M (2002) Toward a pharmacophore for drugs inducing the long qt syndrome: insights from a comfa study of herg k+ channel blockers. J Med Chem 45(18):3844–3853 Ekins S, Crumb WJ, Sarazan RD, Wikel JH, Wrighton SA (2002) Three-dimensional quantitative structure-activity relationship for inhibition of human ether-a-go-go-related gene potassium channel. J Pharmacol Exp Ther 301(2):427–434 Li X, Zhang Y, Li H, Zhao Y (2017) Modeling of the herg k+ channel blockage using online chemical database and modeling environment (ochem). Mol Inform 36(12):1700074 Weininger D (1988) Smiles, a chemical language and information system. 1. introduction to methodology and encoding rules. J Chem Inform Comput Sci 28(1):31–36 Landrum G, et al. (2006) Rdkit: Open-source cheminformatics Jeon W, Kim D (2019) Fp2vec: a new molecular featurizer for learning molecular properties. Bioinformatics Karim A, Mishra A, Newton MH, Sattar A (2019) Efficient toxicity prediction via simple features using shallow neural networks and decision trees. ACS Omega 4(1):1874–1888 Liu K, Sun X, Jia L, Ma J, Xing H, Wu J, Gao H, Sun Y, Boulnois F, Fan J (2019) Chemi-net: a molecular graph convolutional network for accurate drug property prediction. Int J Mol Sci 20(14):3389 Ryu S, Lim J, Hong SH, Kim WY (2018) Deeply learning molecular structure-property relationships using attention-and gate-augmented graph convolutional network. arXiv preprint arXiv:1805.10988 Braga RC, Alves VM, Silva MF, Muratov E, Fourches D, Lião LM, Tropsha A, Andrade CH (2015) Pred-herg: a novel web-accessible computational tool for predicting cardiac toxicity. Mol Inform 34(10):698–701 Ryu JY, Lee MY, Lee JH, Lee BH, Oh K-S (2020) Deephit: a deep learning framework for prediction of herg-induced cardiotoxicity. Bioinformatics 36(10):3049–3055 Ponzoni I, Sebastián-Pérez V, Requena-Triguero C, Roca C, Martínez MJ, Cravero F, Díaz MF, Páez JA, Arrayás RG, Adrio J et al (2017) Hybridizing feature selection and feature learning approaches in qsar modeling for drug discovery. Sci Rep 7(1):1–19 Soto AJ, Cecchini RL, Vazquez GE, Ponzoni I (2009) Multi-objective feature selection in qsar using a machine learning approach. QSAR Comb Sci 28(11–12):1509–1523 Soto A, Martínez M, Cecchini R, Vazquez G, Ponzoni I (2010) Delphos: computational tool for selection of relevant descriptor subsets in admet prediction. In: 1st International Meeting of Pharmaceutical Sciences Dorronsoro I, Chana A, Abasolo MI, Castro A, Gil C, Stud M, Martinez A (2004) Codes/neural network model: a useful tool for in silico prediction of oral absorption and blood-brain barrier permeability of structurally diverse drugs. QSAR Comb Sci 23(2–3):89–98 Gilson MK, Liu T, Baitaluk M, Nicola G, Hwang L, Chong J (2016) Bindingdb in 2015: a public database for medicinal chemistry, computational chemistry and systems pharmacology. Nucleic Acids Res 44(D1):1045–1053 Gaulton A, Bellis LJ, Bento AP, Chambers J, Davies M, Hersey A, Light Y, McGlinchey S, Michalovich D, Al-Lazikani B et al (2012) Chembl: a large-scale bioactivity database for drug discovery. Nucleic Acids Res 40(D1):1100–1107 Didziapetris R, Lanevskij K (2016) Compilation and physicochemical classification analysis of a diverse herg inhibition database. J Comput Aided Mol Des 30(12):1175–1188 RDKit. http://www.rdkit.org/. Accessed 04 Oct 2021 MolVS: Molecule Validation and Standardization — MolVS 0.1.1 documentation. https://molvs.readthedocs.io/en/latest/. Accessed 04 Oct 2021 Siramshetty VB, Chen Q, Devarakonda P, Preissner R (2018) The catch-22 of predicting herg blockade using publicly accessible bioactivity data. J Chem Inform Model 58(6):1224–1233 Konda LSK, Praba SK, Kristam R (2019) herg liability classification models using machine learning techniques. Comput Toxicol 12:100089 Siramshetty VB, Nguyen D-T, Martinez NJ, Southall NT, Simeonov A, Zakharov AV (2020) Critical assessment of artificial intelligence methods for prediction of herg channel inhibition in the “big data” era. J Chem Inform Model 60(12):6007–6019 Cai C, Wu Q, Luo Y, Ma H, Shen J, Zhang Y, Yang L, Chen Y, Wen Z, Wang Q (2017) In silico prediction of rock ii inhibitors by different classification approaches. Mol Divers 21(4):791–807 Maaten Lvd, Hinton G (2008) Visualizing data using t-sne. J Mach Learn Res 9(Nov):2579–2605 Moriwaki H, Tian Y-S, Kawashita N, Takagi T (2018) Mordred: a molecular descriptor calculator. J Cheminfom 10(1):4 Chandrasekaran B, Abed SN, Al-Attraqchi O, Kuche K, Tekade RK (2018) Computer-aided prediction of pharmacokinetic (admet) properties. In: Dosage Form Design Parameters, pp. 731–755. Elsevier Todeschini R, Consonni V (2008) Handbook of mlecular dscriptors, vol 11. Wiley, New York Riniker S, Landrum GA (2013) Open-source platform to benchmark fingerprints for ligand-based virtual screening. J Cheminform 5(1):26 Dong J, Yao Z-J, Zhang L, Luo F, Lin Q, Lu A-P, Chen AF, Cao D-S (2018) Pybiomed: a python library for various molecular representations of chemicals, proteins and DNAs and their interactions. J Cheminform 10(1):16 Rogers D, Hahn M (2010) Extended-connectivity fingerprints. J Chem Inform Model 50(5):742–754 Han L, Wang Y, Bryant SH (2008) Developing and validating predictive decision tree models from mining chemical structural fingerprints and high-throughput screening data in pubchem. BMC Bioinform 9(1):401 Goh GB, Hodas NO, Siegel C, Vishnu A (2017) Smiles2vec: an interpretable general-purpose deep neural network for predicting chemical properties. arXiv preprint arXiv:1712.02034 Karim A, Singh J, Mishra A, Dehzangi A, Newton MH, Sattar A (2019) Toxicity prediction by multimodal deep learning. In: Pacific Rim Knowledge Acquisition Workshop, pp. 142–152. Springer Karim A, Riahi V, Mishra A, Dehzangi A, Newton MH, Sattar A (2019) Quantitative toxicity prediction via ensembling of heterogeneous predictors Chollet F, et al (2015) Keras. https://keras.io Grattarola D, Alippi C (2020) Graph neural networks in tensorflow and keras with spektral. arXiv preprint arXiv:2006.12138 Jarrett K, Kavukcuoglu K, Ranzato M, LeCun Y (2009) What is the best multi-stage architecture for object recognition? In: 2009 IEEE 12th International Conference on Computer Vision, pp. 2146–2153. New York, IEEE Goodfellow I, Bengio Y, Courville A (2016) Deep Learning Han S, Pool J, Tran J, Dally W (2015) Learning both weights and connections for efficient neural network. In: Advances in Neural Information Processing Systems, pp. 1135–1143 Srivastava N, Hinton G, Krizhevsky A, Sutskever I, Salakhutdinov R (2014) Dropout: a simple way to prevent neural networks from overfitting. J Mach Learn Res 15(1):1929–1958 Kipf TN, Welling M (2016) Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907 Li Y, Tarlow D, Brockschmidt M, Zemel R (2015) Gated graph sequence neural networks. arXiv preprint arXiv:1511.05493 Mufei Li JZ (2021) Dgl-lifesci: An open-source toolkit for deep learning on graphs in life science. arXiv preprint arXiv:2106.14232 Breiman L (2001) Random forests. Mach Learn 45(1):5–32 Hearst MA, Dumais ST, Osuna E, Platt J, Scholkopf B (1998) Support vector machines. IEEE Intell Syst Appl 13(4):18–28 Friedman JH (2002) Stochastic gradient boosting. Comput Stat Data Anal 38(4):367–378 Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, Blondel M, Prettenhofer P, Weiss R, Dubourg V, Vanderplas J, Passos A, Cournapeau D, Brucher M, Perrot M, Duchesnay E (2011) Scikit-learn: machine learning in Python. J Mach Learn Res 12:2825–2830