Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Cải thiện sàng lọc ảo dựa trên độ tương đồng cấu trúc bằng cách sử dụng kiến thức nền
Tóm tắt
Sàng lọc ảo dưới hình thức xếp hạng độ tương đồng thường được áp dụng trong quá trình khám phá thuốc ban đầu để xếp hạng và ưu tiên các hợp chất từ cơ sở dữ liệu. Việc xếp hạng độ tương đồng này có thể đạt được bằng các biện pháp tương đồng cấu trúc. Tuy nhiên, tính chung chung của chúng có thể dẫn đến hiệu suất không đủ trong một số trường hợp ứng dụng. Trong bài báo này, chúng tôi cung cấp một liên kết giữa sàng lọc ảo dựa trên xếp hạng và các phương pháp khai thác dữ liệu củng cố dựa trên các fragment. Việc bao gồm kiến thức nền liên quan đến liên kết vào một biện pháp tương đồng cấu trúc cải thiện chất lượng của các xếp hạng độ tương đồng. Kiến thức nền này dưới dạng các cấu trúc con liên quan đến liên kết có thể được lấy ra bằng cách lựa chọn thủ công hoặc bằng các phương pháp khai thác dữ liệu tự động dựa trên fragment. Trong các thí nghiệm sàng lọc ảo, chúng tôi cho thấy rằng phương pháp của chúng tôi cải thiện rõ rệt các yếu tố làm giàu với cả hai biến thể khác nhau của phương pháp: việc mở rộng biện pháp tương đồng cấu trúc với kiến thức nền dưới dạng cấu trúc con liên quan được chọn thủ công hoặc việc mở rộng biện pháp tương đồng với kiến thức nền được lấy ra qua các phương pháp khai thác dữ liệu. Nghiên cứu của chúng tôi cho thấy việc thêm kiến thức nền liên quan đến liên kết có thể dẫn đến các xếp hạng độ tương đồng được cải thiện một cách đáng kể trong sàng lọc ảo và rằng ngay cả các phương pháp khai thác dữ liệu cơ bản cũng có thể dẫn đến các kết quả cạnh tranh, làm cho việc lựa chọn thủ công kiến thức nền trở nên ít quan trọng hơn. Điều này đặc biệt quan trọng trong các dự án khám phá và phát triển thuốc, nơi không có cấu trúc thụ thể có sẵn hoặc thường xuyên không có chế độ liên kết đã được xác minh và chủ yếu các phương pháp dựa trên ligand có thể được áp dụng để tạo ra các hợp chất tiềm năng.
Từ khóa
#sàng lọc ảo #độ tương đồng cấu trúc #khai thác dữ liệu #kiến thức nền #khám phá thuốcTài liệu tham khảo
Terstappen G, Reggiani A: In silico research in drug discovery. Trends Pharmacol Sci. 2001, 22: 23-26.
van de Waterbeemed H, Gifford E: ADMET in silico modelling: towards prediction paradise?. Nat Rev Drug Discov. 2003, 2: 192-204. 10.1038/nrd1032.
Rückert U, Kramer S: Frequent free tree discovery in graph data. Proceedings of the ACM SIG Symposium on Applied Computing (SAC’04). 2004, New York, NY, USA: ACM Press, 564-570.
Raymond J, Gardiner E, Willett P: RASCAL: calculation of graph similarity using maximum common edge subgraphs. Comput J. 2002, 45 (6): 631-644. 10.1093/comjnl/45.6.631.
Rogers D, Hahn M: Extended-connectivity fingerprints. J Chem Inf Model. 2010, 50 (5): 742-754. 10.1021/ci100050t.
Wallis W, Shoubridge P, Kraetz M, Ray D: Graph distances using graph union. Pattern Recognit Lett. 2001, 22: 701-704. 10.1016/S0167-8655(01)00022-8. [http://dx.doi.org/10.1016/S0167-8655(01)00022-8],
Weininger D, Weininger A, Weininger J: SMILES. 2. algorithm for generation of unique SMILES notation. J Chem Inf Comput Sci. 1989, 29 (2): 97-101. 10.1021/ci00062a008.
Stalring J, Carlsson L, Almeida P, Boyer S: AZOrange-High performance open source machine learning for QSAR modeling in a graphical programming environment. J Cheminformatics. 2011, 3: 28-10.1186/1758-2946-3-28.
Knox C, Law V, Jewison T, Liu P, Ly S, Frolkis A, Pon A, Banco K, Mak C, Neveu V, Djoumbou Y, Eisner R, Guo AC, Wishart DS: DrugBank 3.0: a comprehensive resource for ‘Omics’ research on drugs. Nucl Acids Res. 2011, 39 (suppl 1): D1035-D1041.
Huang N, Shoichet B, Irwin J: Benchmarking sets for molecular docking. J Med Chem. 2006, 49 (23): 6789-6801. 10.1021/jm0608356.
Heikamp K, Bajorath J: Large-scale similarity search profiling of ChEMBL compound data sets. J Chem Inf Model. 2011, 51 (8): 1831-1839. 10.1021/ci200199u.
Irwin JJ, Sterling T, Mysinger MM, Bolstad ES, Coleman RG: ZINC: a free tool to discover chemistry for biology. J Chem Inf Model. 2012, 52 (7): 1757-1768. 10.1021/ci3001277.
Lewington S, Whitlock G, Clarke R, Sherliker P, Emberson J, Halsey J, Qizilbash N, Peto R, Collins R: Blood cholesterol and vascular mortality by age, sex, and blood pressure: a meta-analysis of individual data from 61 prospective studies with 55000 vascular deaths. The Lancet. 2007, 370 (9602): 1829-1839.
Eisenberg D: Cholesterol lowering in the management of coronary artery disease: the clinical implications of recent trials. Am J Med. 1998, 104 (2, Supplement 1): 2S-5S. 10.1016/S0002-9343(98)00038-2.
Endo A, Kuroda M, Tanzawa K: Competitive inhibition of 3-hydroxy-3-methylglutaryl coenzyme A reductase by ML-236A and ML-236B fungal metabolites, having hypocholesterolemic activity. FEBS Lett. 1976, 72 (2): 323-326. 10.1016/0014-5793(76)80996-9.
Berman H, Westbrook J, Feng Z, Gilliland G, Bhat T, Weissig H, Shindyalov I, Bourne P: The protein data bank. Nucl Acids Res. 2000, 28: 235-242. 10.1093/nar/28.1.235.
Istvan E, Deisenhofer J: Structural mechanism for statin inhibition of HMG-CoA reductase. Science. 2001, 292 (5519): 1160-1164. 10.1126/science.1059344. [http://www.sciencemag.org/content/292/5519/1160.abstract],
Scarsi M, Podvinec M, Roth A, Hug H, Kersten S, Albrecht H, Schwede T, Meyer UA, Ruecker C: Sulfonylureas and Glinides exhibit peroxisome proliferator-activated receptor gamma activity: A combined virtual screening and biological assay approach. Mol Pharmacol. 2007, 71 (2): 398-406.
Bemis GW, Murcko MA: The properties of known drugs. 1. Molecular frameworks. J Med Chem. 1996, 39 (15): 2887-2893. 10.1021/jm9602928.
Evers A, Klabunde T: Structure-based drug discovery using GPCR homology modeling: successful virtual screening for antagonists of the alpha1A adrenergic receptor. J Med Chem. 2005, 48 (4): 1088-1097. 10.1021/jm0491804.
Liberato MV, Nascimento AS, Ayers SD, Lin JZ, Cvoro A, Silveira RL, Martínez L, Souza PCT, Saidemberg D, Deng T, Amato AA, Togashi M, Hsueh WA, Phillips K, Palma MS, Neves FAR, Skaf MS, Webb P, Polikarpov I: Medium chain fatty acids are selective peroxisome proliferator activated receptor (PPAR) gamma activators and Pan-PPAR partial agonists. PLoS ONE. 2012, 7 (5): e36297-10.1371/journal.pone.0036297.
Demšar J: Statistical comparisons of classifiers over multiple data sets. J Mach Learn Res. 2006, 7: 1-30.
Hert J, Willett P, Wilton DJ, Acklin P, Azzaoui K, Jacoby E, Schuffenhauer A: Comparison of topological descriptors for similarity-based virtual screening using multiple bioactive reference structures. Org Biomol Chem. 2004, 2: 3256-3266. 10.1039/b409865j.