Mô hình lọc cộng tác dựa trên xác suất để dự đoán mối liên hệ gene–bệnh

BMC Medical Genomics - Tập 10 - Trang 45-53 - 2017
Xiangxiang Zeng1,2, Ningxiang Ding1, Alfonso Rodríguez-Patón2, Quan Zou3
1Department of Computer Science, School of Information Science and Technology, Xiamen University, Xiamen, China
2Department of Artificial Intelligence, Universidad Politcnica de Madrid (UPM), Madrid, Spain
3School of Computer Science and Technology, Tianjin University, Tianjin, China

Tóm tắt

Việc dự đoán chính xác các gene gây bệnh ở người đã gặp nhiều thách thức trong các nghiên cứu gần đây. Với việc xem xét dữ liệu gene–bệnh phong phú được xác minh qua các thí nghiệm sinh học, chúng ta có thể áp dụng các phương pháp tính toán để thực hiện các dự đoán chính xác với thời gian và chi phí giảm thiểu. Chúng tôi đề xuất một mô hình lọc cộng tác dựa trên xác suất (PCFM) để dự đoán các gene gây bệnh ở người. Nhiều loại dữ liệu, bao gồm dữ liệu của con người và dữ liệu của các loài phi nhân, được tích hợp trong mô hình của chúng tôi. Đầu tiên, dựa trên một mô hình phân tích ẩn điển hình, chúng tôi đề xuất mô hình I với các điều chỉnh không đồng nhất trung bình. Thứ hai, chúng tôi phát triển mô hình II đã được chỉnh sửa với các điều chỉnh không đồng nhất cá nhân để nâng cao độ chính xác của các mô hình đã đề cập. Trong mô hình này, các chỉ số tương đồng không gian vector hoặc hệ số tương quan Pearson cũng như dữ liệu trên các loài có liên quan cũng được sử dụng. Chúng tôi so sánh kết quả của PCFM với kết quả của bốn phương pháp tiên tiến khác. Kết quả cho thấy rằng PCFM hoạt động tốt hơn so với các phương pháp tiên tiến khác. Mô hình PCFM có thể được tận dụng cho việc dự đoán các gene gây bệnh, đặc biệt là cho các gene mới ở người hoặc các bệnh không có mối quan hệ đã biết.

Từ khóa

#gene #bệnh #mô hình lọc cộng tác #dự đoán #xác suất

Tài liệu tham khảo

Giallourakis C, Henson C, Reich M, Xie X, Mootha VK. Disease gene discovery through integrative genomics. Annu Rev Genomics Hum Genet. 2005;6:381–406.

Su X, Khoshgoftaar TM. A survey of collaborative filtering techniques. Adv Artificial Intellig. 2009;2009. doi:10.1155/2009/421425.

Bennett J, Lanning S, Netflix N. The Netflix prize. In: Kdd cup and workshop in conjunction with Kdd; 2009.

Koren Y. Factorization meets the neighborhood: a multifaceted collaborative filtering model. In: ACM SIGKDD international conference on knowledge discovery and data mining, Las Vegas, Nevada, Usa, August, 2008, pp. 426-434.

Yang SH, Long B, Smola A, Sadagopan N, Zheng Z, Zha H. Like like alike — joint friendship and interest propagation in social networks. In: International conference on world wide web, WWW 2011, Hyderabad, India, March 28 - April, 2011, pp. 537-546.

Paterek A. Improving regularized singular value decomposition for collaborative filtering. In Proceedings of KDD cup and workshop. 2007:5–8.