Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Thuật toán đối sánh văn bản tự do: Chương trình máy tính trích xuất chẩn đoán và nguyên nhân tử vong từ văn bản không có cấu trúc trong hồ sơ sức khỏe điện tử
Tóm tắt
Hồ sơ sức khỏe điện tử là nguồn thông tin quý giá cho nghiên cứu y học, nhưng nhiều thông tin thường được lưu trữ dưới dạng văn bản tự do thay vì dạng mã hóa. Ví dụ, trong Cơ sở dữ liệu Nghiên cứu Thực hành Tổng quát của Vương quốc Anh (GPRD), nguyên nhân tử vong và kết quả xét nghiệm đôi khi chỉ được ghi nhận dưới dạng văn bản tự do. Văn bản tự do có thể gặp khó khăn trong nghiên cứu nếu cần đến việc xem xét thủ công mất nhiều thời gian. Mục tiêu của chúng tôi là phát triển phương pháp tự động để trích xuất thông tin mã hóa từ văn bản tự do trong hồ sơ điện tử của bệnh nhân. Chúng tôi đã xem xét hồ sơ điện tử của 3310 bệnh nhân trong GPRD qua đời năm 2001, để xác định nguyên nhân tử vong. Chúng tôi phát triển một chương trình máy tính gọi là Thuật toán Đối Sánh Văn Bản Tự Do (FMA) để ánh xạ chẩn đoán trong văn bản sang Thuật Ngữ Lâm Sàng Read. Chương trình sử dụng bảng tra cứu từ đồng nghĩa và mẫu câu để xác định chẩn đoán, ngày tháng và các kết quả xét nghiệm được chọn. Chúng tôi đã kiểm tra nó trên hai mẫu ngẫu nhiên của văn bản tự do từ GPRD (1000 văn bản liên quan đến tử vong trong năm 2001, và 1000 văn bản chung từ các trường hợp bệnh mạch vành trong nghiên cứu), so sánh đầu ra với chương trình MetaMap của Thư viện Y học Quốc gia Hoa Kỳ và chuẩn vàng của xem xét thủ công. Trong số 3310 bệnh nhân trong GPRD qua đời năm 2001, nguyên nhân tử vong được ghi nhận dưới dạng mã hóa ở 38,1% bệnh nhân, và chỉ trong văn bản tự do ở 19,4%. Trên 1000 văn bản liên quan đến tử vong, FMA mã hóa 683 trong số 735 chẩn đoán dương tính, với độ chính xác (giá trị dự đoán dương tính) 98,4% (khoảng tin cậy 95% (CI) 97,2, 99,2) và hồi tưởng (độ nhạy) 92,9% (CI 95% 90,8, 94,7). Trên mẫu tổng quát, FMA phát hiện 346 trong số 447 chẩn đoán dương tính, với độ chính xác 91,5% (CI 95% 88,3, 94,1) và hồi tưởng 77,4% (CI 95% 73,2, 81,2), tương đối giống MetaMap. Chúng tôi đã phát triển một thuật toán để trích xuất thông tin mã hóa từ văn bản tự do trong hồ sơ GP với độ chính xác tốt. Nó có thể hỗ trợ nghiên cứu sử dụng văn bản tự do trong hồ sơ điện tử của bệnh nhân, đặc biệt để trích xuất nguyên nhân tử vong.
Từ khóa
#hồ sơ sức khỏe điện tử #văn bản tự do #thuật toán đối sánh văn bản tự do #nguyên nhân tử vong #thuật ngữ lâm sàng Read #MetaMap #mã hóa thông tin #chẩn đoán #hồi tưởng #độ chính xácTài liệu tham khảo
