Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
CardioTox net: một công cụ dự đoán chắc chắn cho việc chặn kênh hERG dựa trên các tổ hợp meta-feature học sâu
Tóm tắt
Việc chặn kênh gene liên quan đến ether-a-go-go (hERG) bằng các phân tử nhỏ là một mối quan tâm lớn trong quá trình phát triển thuốc trong ngành dược phẩm. Việc chặn các kênh hERG có thể gây ra khoảng QT kéo dài, điều này có thể dẫn đến độc tính tim mạch. Nhiều kỹ thuật in-silico, bao gồm các mô hình học sâu, được sử dụng rộng rãi để sàng lọc các phân tử nhỏ có độc tính liên quan đến hERG tiềm năng. Hầu hết các phương pháp học sâu đã đăng được sử dụng một loại đặc điểm duy nhất, điều này có thể hạn chế hiệu suất của chúng. Các phương pháp dựa trên nhiều loại đặc điểm hơn, chẳng hạn như DeepHIT, gặp khó khăn trong việc tổng hợp thông tin đã được trích xuất. DeepHIT cho thấy hiệu suất tốt hơn khi được đánh giá dựa trên một hoặc hai chỉ số độ chính xác như giá trị dự đoán âm (NPV) và độ nhạy (SEN), nhưng gặp khó khăn khi được đánh giá dựa trên các chỉ số khác như hệ số tương quan Matthew (MCC), độ chính xác (ACC), giá trị dự đoán dương (PPV) và tính đặc hiệu (SPE). Do đó, cần có một phương pháp có thể tổng hợp hiệu quả thông tin thu được từ các mô hình dựa trên các đại diện hóa học khác nhau và tăng cường dự đoán độc tính hERG trên một loạt các chỉ số hiệu suất. Trong bài báo này, chúng tôi đề xuất một khuôn khổ học sâu dựa trên đào tạo từng bước để dự đoán hoạt động chặn kênh hERG của các phân tử nhỏ. Phương pháp của chúng tôi sử dụng năm mô hình học sâu cơ sở riêng biệt với các đặc điểm cơ sở tương ứng và một mạng nơ-ron riêng biệt để kết hợp đầu ra của năm mô hình cơ sở. Bằng cách sử dụng ba bộ kiểm tra độc lập bên ngoài với hoạt động mạnh IC50 ở ngưỡng 10 µm, phương pháp của chúng tôi đạt hiệu suất tốt hơn cho sự kết hợp các chỉ số phân loại. Chúng tôi cũng điều tra việc tổng hợp hiệu quả thông tin hóa học đã được trích xuất để dự đoán hoạt động hERG chắc chắn. Tóm lại, CardioTox net có thể hoạt động như một công cụ mạnh mẽ để sàng lọc các phân tử nhỏ cho việc chặn kênh hERG trong các quy trình phát hiện thuốc và hoạt động tốt hơn so với các phương pháp đã được báo cáo trước đó trên một loạt các chỉ số phân loại.
Từ khóa
#hERG #độc tính tim mạch #chặn kênh ion #mô hình học sâu #sàng lọc thuốc #thông tin hóa họcTài liệu tham khảo
Priest B, Bell IM, Garcia M (2008) Role of herg potassium channel assays in drug development. Channels 2(2):87–93
Redfern W, Carlsson L, Davis A, Lynch W, MacKenzie I, Palethorpe S, Siegl P, Strang I, Sullivan A, Wallis R et al (2003) Relationships between preclinical cardiac electrophysiology, clinical qt interval prolongation and torsade de pointes for a broad range of drugs: evidence for a provisional safety margin in drug development. Cardiovas Res 58(1):32–45
Aronov AM (2006) Common pharmacophores for uncharged human ether-a-go-go-related gene (herg) blockers. J Med Chem 49(23):6917–6921
Villoutreix BO, Taboureau O (2015) Computational investigations of herg channel blockers: new insights and current predictive models. Adv Drug Deliv Rev 86:72–82
Darpo B, Nebout T, Sager PT (2006) Clinical evaluation of qt/qtc prolongation and proarrhythmic potential for nonantiarrhythmic drugs: the international conference on harmonization of technical requirements for registration of pharmaceuticals for human use e14 guideline. J Clin Pharmacol 46(5):498–507
Cai C, Guo P, Zhou Y, Zhou J, Wang Q, Zhang F, Fang J, Cheng F (2019) Deep learning-based prediction of drug-induced cardiotoxicity. J Chem Inform Model 59(3):1073–1084
Doddareddy MR, Klaasse EC, IJzerman AP, Bender A (2010) Prospective validation of a comprehensive in silico herg model and its applications to commercial compound and drug databases. ChemMedChem 5(5):716–729
Lee H-M, Yu M-S, Kazmi SR, Oh SY, Rhee K-H, Bae M-A, Lee BH, Shin D-S, Oh K-S, Ceong H et al (2019) Computational determination of herg-related cardiotoxicity of drug candidates. BMC Bioinform 20(10):250
Cavalli A, Poluzzi E, De Ponti F, Recanatini M (2002) Toward a pharmacophore for drugs inducing the long qt syndrome: insights from a comfa study of herg k+ channel blockers. J Med Chem 45(18):3844–3853
Ekins S, Crumb WJ, Sarazan RD, Wikel JH, Wrighton SA (2002) Three-dimensional quantitative structure-activity relationship for inhibition of human ether-a-go-go-related gene potassium channel. J Pharmacol Exp Ther 301(2):427–434
Li X, Zhang Y, Li H, Zhao Y (2017) Modeling of the herg k+ channel blockage using online chemical database and modeling environment (ochem). Mol Inform 36(12):1700074
Weininger D (1988) Smiles, a chemical language and information system. 1. introduction to methodology and encoding rules. J Chem Inform Comput Sci 28(1):31–36
Landrum G, et al. (2006) Rdkit: Open-source cheminformatics
Jeon W, Kim D (2019) Fp2vec: a new molecular featurizer for learning molecular properties. Bioinformatics
Karim A, Mishra A, Newton MH, Sattar A (2019) Efficient toxicity prediction via simple features using shallow neural networks and decision trees. ACS Omega 4(1):1874–1888
Liu K, Sun X, Jia L, Ma J, Xing H, Wu J, Gao H, Sun Y, Boulnois F, Fan J (2019) Chemi-net: a molecular graph convolutional network for accurate drug property prediction. Int J Mol Sci 20(14):3389
Ryu S, Lim J, Hong SH, Kim WY (2018) Deeply learning molecular structure-property relationships using attention-and gate-augmented graph convolutional network. arXiv preprint arXiv:1805.10988
Braga RC, Alves VM, Silva MF, Muratov E, Fourches D, Lião LM, Tropsha A, Andrade CH (2015) Pred-herg: a novel web-accessible computational tool for predicting cardiac toxicity. Mol Inform 34(10):698–701
Ryu JY, Lee MY, Lee JH, Lee BH, Oh K-S (2020) Deephit: a deep learning framework for prediction of herg-induced cardiotoxicity. Bioinformatics 36(10):3049–3055
Ponzoni I, Sebastián-Pérez V, Requena-Triguero C, Roca C, Martínez MJ, Cravero F, Díaz MF, Páez JA, Arrayás RG, Adrio J et al (2017) Hybridizing feature selection and feature learning approaches in qsar modeling for drug discovery. Sci Rep 7(1):1–19
Soto AJ, Cecchini RL, Vazquez GE, Ponzoni I (2009) Multi-objective feature selection in qsar using a machine learning approach. QSAR Comb Sci 28(11–12):1509–1523
Soto A, Martínez M, Cecchini R, Vazquez G, Ponzoni I (2010) Delphos: computational tool for selection of relevant descriptor subsets in admet prediction. In: 1st International Meeting of Pharmaceutical Sciences
Dorronsoro I, Chana A, Abasolo MI, Castro A, Gil C, Stud M, Martinez A (2004) Codes/neural network model: a useful tool for in silico prediction of oral absorption and blood-brain barrier permeability of structurally diverse drugs. QSAR Comb Sci 23(2–3):89–98
Gilson MK, Liu T, Baitaluk M, Nicola G, Hwang L, Chong J (2016) Bindingdb in 2015: a public database for medicinal chemistry, computational chemistry and systems pharmacology. Nucleic Acids Res 44(D1):1045–1053
Gaulton A, Bellis LJ, Bento AP, Chambers J, Davies M, Hersey A, Light Y, McGlinchey S, Michalovich D, Al-Lazikani B et al (2012) Chembl: a large-scale bioactivity database for drug discovery. Nucleic Acids Res 40(D1):1100–1107
Didziapetris R, Lanevskij K (2016) Compilation and physicochemical classification analysis of a diverse herg inhibition database. J Comput Aided Mol Des 30(12):1175–1188
RDKit. http://www.rdkit.org/. Accessed 04 Oct 2021
MolVS: Molecule Validation and Standardization — MolVS 0.1.1 documentation. https://molvs.readthedocs.io/en/latest/. Accessed 04 Oct 2021
Siramshetty VB, Chen Q, Devarakonda P, Preissner R (2018) The catch-22 of predicting herg blockade using publicly accessible bioactivity data. J Chem Inform Model 58(6):1224–1233
Konda LSK, Praba SK, Kristam R (2019) herg liability classification models using machine learning techniques. Comput Toxicol 12:100089
Siramshetty VB, Nguyen D-T, Martinez NJ, Southall NT, Simeonov A, Zakharov AV (2020) Critical assessment of artificial intelligence methods for prediction of herg channel inhibition in the “big data” era. J Chem Inform Model 60(12):6007–6019
Cai C, Wu Q, Luo Y, Ma H, Shen J, Zhang Y, Yang L, Chen Y, Wen Z, Wang Q (2017) In silico prediction of rock ii inhibitors by different classification approaches. Mol Divers 21(4):791–807
Maaten Lvd, Hinton G (2008) Visualizing data using t-sne. J Mach Learn Res 9(Nov):2579–2605
Moriwaki H, Tian Y-S, Kawashita N, Takagi T (2018) Mordred: a molecular descriptor calculator. J Cheminfom 10(1):4
Chandrasekaran B, Abed SN, Al-Attraqchi O, Kuche K, Tekade RK (2018) Computer-aided prediction of pharmacokinetic (admet) properties. In: Dosage Form Design Parameters, pp. 731–755. Elsevier
Todeschini R, Consonni V (2008) Handbook of mlecular dscriptors, vol 11. Wiley, New York
Riniker S, Landrum GA (2013) Open-source platform to benchmark fingerprints for ligand-based virtual screening. J Cheminform 5(1):26
Dong J, Yao Z-J, Zhang L, Luo F, Lin Q, Lu A-P, Chen AF, Cao D-S (2018) Pybiomed: a python library for various molecular representations of chemicals, proteins and DNAs and their interactions. J Cheminform 10(1):16
Rogers D, Hahn M (2010) Extended-connectivity fingerprints. J Chem Inform Model 50(5):742–754
Han L, Wang Y, Bryant SH (2008) Developing and validating predictive decision tree models from mining chemical structural fingerprints and high-throughput screening data in pubchem. BMC Bioinform 9(1):401
Goh GB, Hodas NO, Siegel C, Vishnu A (2017) Smiles2vec: an interpretable general-purpose deep neural network for predicting chemical properties. arXiv preprint arXiv:1712.02034
Karim A, Singh J, Mishra A, Dehzangi A, Newton MH, Sattar A (2019) Toxicity prediction by multimodal deep learning. In: Pacific Rim Knowledge Acquisition Workshop, pp. 142–152. Springer
Karim A, Riahi V, Mishra A, Dehzangi A, Newton MH, Sattar A (2019) Quantitative toxicity prediction via ensembling of heterogeneous predictors
Chollet F, et al (2015) Keras. https://keras.io
Grattarola D, Alippi C (2020) Graph neural networks in tensorflow and keras with spektral. arXiv preprint arXiv:2006.12138
Jarrett K, Kavukcuoglu K, Ranzato M, LeCun Y (2009) What is the best multi-stage architecture for object recognition? In: 2009 IEEE 12th International Conference on Computer Vision, pp. 2146–2153. New York, IEEE
Goodfellow I, Bengio Y, Courville A (2016) Deep Learning
Han S, Pool J, Tran J, Dally W (2015) Learning both weights and connections for efficient neural network. In: Advances in Neural Information Processing Systems, pp. 1135–1143
Srivastava N, Hinton G, Krizhevsky A, Sutskever I, Salakhutdinov R (2014) Dropout: a simple way to prevent neural networks from overfitting. J Mach Learn Res 15(1):1929–1958
Kipf TN, Welling M (2016) Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907
Li Y, Tarlow D, Brockschmidt M, Zemel R (2015) Gated graph sequence neural networks. arXiv preprint arXiv:1511.05493
Mufei Li JZ (2021) Dgl-lifesci: An open-source toolkit for deep learning on graphs in life science. arXiv preprint arXiv:2106.14232
Breiman L (2001) Random forests. Mach Learn 45(1):5–32
Hearst MA, Dumais ST, Osuna E, Platt J, Scholkopf B (1998) Support vector machines. IEEE Intell Syst Appl 13(4):18–28
Friedman JH (2002) Stochastic gradient boosting. Comput Stat Data Anal 38(4):367–378
Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, Blondel M, Prettenhofer P, Weiss R, Dubourg V, Vanderplas J, Passos A, Cournapeau D, Brucher M, Perrot M, Duchesnay E (2011) Scikit-learn: machine learning in Python. J Mach Learn Res 12:2825–2830