Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Giải quyết anaphora cho việc trích xuất tương tác giữa các loại thuốc trong tài liệu dược lý
Tóm tắt
Tương tác giữa các loại thuốc thường được báo cáo trong một lượng ngày càng tăng của tài liệu y sinh. Các kỹ thuật Trích xuất Thông tin (IE) đã được phát triển như một công cụ hữu ích để quản lý kiến thức này. Tuy nhiên, IE ở mức câu có hiệu quả hạn chế do các tham chiếu thường xuyên đến các thực thể trước đó trong diễn ngôn, một hiện tượng được gọi là 'anaphora'. DrugNerAR, một hệ thống giải quyết anaphora thuốc được giới thiệu nhằm giải quyết vấn đề các biểu thức tham chiếu đồng trong tài liệu dược lý. Sự phát triển này là một phần của một nghiên cứu lớn và đổi mới về việc trích xuất tự động tương tác giữa các loại thuốc. Hệ thống sử dụng một tập hợp các quy tắc ngôn ngữ được rút ra từ Lý thuyết Trung tâm trên cơ sở phân tích do một bộ phân tích cú pháp y sinh cung cấp. Thông tin ngữ nghĩa do Hệ thống Ngôn ngữ Y tế Thống nhất (UMLS) cung cấp cũng được tích hợp để cải thiện khả năng nhận diện và giải quyết các anaphor thuốc danh nghĩa. Bên cạnh đó, một tập hợp dữ liệu đã được phát triển để phân tích các hiện tượng và đánh giá phương pháp hiện tại. Mỗi trường hợp có thể xảy ra của biểu thức anaphoric đã được xem xét để xác định cách giải quyết hiệu quả nhất. Một F-score là 0.76 trong việc giải quyết anaphora đã đạt được, vượt trội hơn đáng kể so với giá trị cơ sở gần 73%. Đường tham chiếu ad-hoc này được phát triển để kiểm tra các kết quả vì không có công trình trước đó về việc giải quyết anaphora trong tài liệu dược lý. Các kết quả thu được tương tự như các kết quả tìm thấy trong các lĩnh vực ngữ nghĩa liên quan. Phương pháp hiện tại cho thấy kết quả rất hứa hẹn trong thách thức xử lý các biểu thức anaphoric trong văn bản dược lý. DrugNerAr đạt được kết quả tương tự như các phương pháp khác xử lý giải quyết anaphora trong lĩnh vực y sinh, nhưng, không giống như những phương pháp này, nó tập trung vào các tài liệu phản ánh các tương tác thuốc. Lý thuyết Trung tâm đã chứng minh là hiệu quả trong việc lựa chọn những antecedent trong việc giải quyết anaphora. Một thành phần chủ chốt trong sự thành công của khung này là phân tích do chương trình MMTx và hệ thống DrugNer cung cấp, cho phép xử lý sự phức tạp của ngôn ngữ dược lý. Dự kiến rằng các kết quả tích cực của bộ giải quyết sẽ nâng cao hiệu suất của hệ thống trích xuất tương tác giữa các loại thuốc trong tương lai của chúng tôi.
Từ khóa
#tương tác thuốc #giải quyết anaphora #trích xuất thông tin #văn bản dược lý #lý thuyết trung tâmTài liệu tham khảo
Kimura RE, Chen YC, Jiyamapa-Sherna V, Hamman MA, Hall SD, Galinsky RE: Improved prediction of drug interactions using in vivo Ki. Clin Pharmacol Ther 2004, 75: P81. 10.1016/j.clpt.2003.11.308
Strieker BHC, Psaty BM: Detection, verification, and quantification of adverse drug reactions. Br Med J 2004, 329: 44–47. 10.1136/bmj.329.7456.44
Pirmohamed M, James S, Meakin S, Green C, Seott AK, Walley TJ, Farrar K, Park BK, Breekenridge AM: Adverse drug reactions as cause of admission to hospital: prospective analysis of 18 820 patients. Br Med J 2004, 329: 15–19. 10.1136/bmj.329.7456.15
Vitry AI: Comparative assessment of four drug interaction compendia. Br J Clin Pharmacol 2007, 63: 709. 10.1111/j.1365-2125.2006.02809.x
Aronson JK: Communicating information about drug interactions. Br J Clin Pharmacol 2007, 63: 637–639. 10.1111/j.1365-2125.2007.02948.x
Wishart DS, Knox C, Guo AC, Shrivastava S, Hassanali M, Stothard P, Chang Z, Woolsey J: DrugBank: a comprehensive resource for in silico drug discovery and exploration. Nucleic Acids Res 2006, 34: D668-D672. 10.1093/nar/gkj067
Wishart DS, Knox C, Guo AC, Cheng D, Shrivastava S, Tzur D, Gautam B, Hassanali M: DrugBank: a knowledgebase for drugs, drug actions and drug targets. Nucleic Acids Res 2007, 36: D901-D906. 10.1093/nar/gkm958
Poesio M, Ishikawa T, im Walde SS, Viera R: Acquiring lexical knowledge for anaphora resolution. Proceedings of the Third Conference on Language Resources and Evaluation (LREC): 29–31 May 2002, Las Palmas 2002.
Refoufi A: A Multiple Knowledge Sources Algorithm for Anaphora Resolution. Asian Journal of Information Technology 2006, 5: 48–53.
Wu DS, Liang T: Zero anaphora resolution by case-based reasoning and pattern conceptualization. Expert Systems With Applications 2009, 36(4):7544–7551. 10.1016/j.eswa.2008.09.065
Buneseu R: Associative anaphora resolution: A web-based approach. Proceedings of the EACL-2003 Workshop on the Computational Treatment of Anaphora: 14 April, Budapest 2003, 47–52.
Ng V: Supervised ranking for pronoun resolution: Some recent improvements. In Proceedings of the National Conference on Artificial Intelligence: 9–13 June 2005, Pennsylvania, Volume 20. Menlo Park, CA; Cambridge, MA; London; AAAI Press; MIT Press; 1999; 2005:1081.
Castano J, Zhang J, Pustejovsky J: Anaphora resolution in biomedical literature. International Symposium on Reference Resolution for Natural Language Processing: 3–4 June 2002, Alicante 2002.
Lin Y, Liang T, Hsinehu T: Pronominal and sortal anaphora resolution for biomedical literature. Proceedings of ROCLING XVI: Conference on Computational Linguistics and Speech Processing: 2–3 September 2004, Taiwan 2004.
Kim JD, Ohta T, Tateisi Y, Tsujii J: GENIA corpus-a semantically annotated corpus for bio-textmining. Bioinformatics 2003, 19(90001):180–182. 10.1093/bioinformatics/btg1023
Pustejovsky J, Castano J, Saurl R, Rumshinsky A, Zhang J, Luo W: Medstract: creating large-scale information servers for biomedical libraries. Proceedings of the ACL-02 workshop on Natural language processing in the biomedical domain: 11 July 2002, Philadelphia, 2002, 85–92. full_text
Liang T, Lin Y: Anaphora Resolution for Biomedical Literature by Exploiting Multiple Resources. Lecture notes in computer science 2005, 3651: 742. full_text
Kim JJ, Park JC: BioAR: Anaphora resolution for relating protein names to proteome database entries. Proceedings of the workshop on reference resolution and its applications, ACL: 25–26 July 2004, Barcelona 2004, 79–86.
Grosz BJ, Weinstein S, Joshi AK: Centering: A framework for modeling the local coherence of discourse. Computational linguistics 1995, 21: 203–225.
Kim JJ, Park JC: BioIE: retargetable information extraction and ontological annotation of biological interactions from the literature. J Bioinform Comput Biol 2004, 2(3):551. 10.1142/S0219720004000739
Sanchez O, Poesio M, Kabadjov MA, Tesar R: What kind of problems do protein interactions raise for anaphora resolution? A preliminary analysis. In Proceedings of second symposium on Semantic Mining in Biomedicine: 9–12 April 2006, Jena. Edited by: Ananiadou S, Fluek J. 2006, 109–112.
Poesio M, Kabadjov MA: A general-purpose, off-the-shelf anaphora resolution module: Implementation and preliminary evaluation. Proceedings of the fourth International Conference on Language Resources and Evaluation: 26–28 May 2004, Lisbon 2004.
Nguyen NLT, Kim JD: Exploring Domain Differences for the Design of Pronoun Resolution Systems for Biomedical Text. Proceedings of the 22nd International Conference on Computational Linguistics (Coling 2008): 18–22 August, 2008, Manchester 2008, 625–632.
Gasperin C, Building W: Semi-supervised anaphora resolution in biomedical texts. Proceedings of the BioNLP Workshop on Linking Natural Language Processing and Biology at HLT-NAACL: 8 June 2006, New York, Volume 6 2006, 6: 96–103.
Briseoe T, Carroll J: Robust accurate statistical annotation of general text. Proceedings of the Third International Conference on Language Resources and Evaluation (LREC): 29–31 May 2002, Las Palmas 2002, 1499–1504.
Segura-Bedmar I, Crespo M, de Pablo-Sanehez C: Score-based approach for Anaphora Resolution in Drug-Drug Interactions Documents. In Proceedings of the Fourteenth International Conference on Applications of Natural Language to Information Systems: 23–26 June 2009; Saarbriicken,. Saarland University; 2009:16–27.
Segura-Bedmar I, Martinez P, Segura-Bedmar M: Drug name recognition and classification in biomedical texts A case study outlining approaches underpinning automated systems. Drug Discov Today 2008, 13(17–18):816–823. 10.1016/j.drudis.2008.06.001
World Health Organization Press: The use of stems in the selection of International Nonproprietary Names (INN) for pharmaceutical substances. 2006.
openKapow[http://www.openkapow.com/]
