Phương pháp xử lý kết hợp trước khi thu thập cung cấp thêm sức mạnh trong việc phát hiện biến đổi số lượng bản sao trong giải trình tự exome

BMC Bioinformatics - Tập 22 Số 1 - 2021
Dayne L. Filer1,2, Fengshen Kuo2, Alicia Brandt1, Christian R. Tilley1, Piotr A. Mieczkowski1, Jonathan S. Berg1, Kimberly Robasky1,2, Yun Li3,1, Chris Bizon2, Jeffery L. Tilson2, Bradford C. Powell1,2, Darius M. Bost1,2, Clark Jeffries2, Kirk C. Wilhelmsen1,2
1Department of Genetics, UNC School of Medicine, Chapel Hill, USA
2Renaissance Computing Institute, Chapel Hill, USA
3Department of Biostatistics, UNC Gillings School of Global Public Health, Chapel Hill, USA

Tóm tắt

Tóm tắt Giới thiệu

Khi việc giải trình tự exome (ES) được tích hợp vào thực hành lâm sàng, chúng ta nên nỗ lực tối đa để sử dụng mọi thông tin được tạo ra. Biến thể số lượng bản sao có thể dẫn đến các rối loạn Mendel, nhưng những biến thể số lượng bản sao nhỏ (CNVs) thường bị bỏ qua hoặc bị che khuất bởi việc thu thập dữ liệu không đủ mạnh. Nhiều nhóm nghiên cứu đã phát triển phương pháp xác định CNVs từ ES, nhưng các phương pháp hiện có thường hoạt động kém đối với các CNV nhỏ và dựa vào số lượng mẫu lớn mà không phải lúc nào cũng có sẵn cho các phòng thí nghiệm lâm sàng. Hơn nữa, các phương pháp thường dựa vào các cách tiếp cận Bayesian yêu cầu người dùng xác định các thông tin trước trong bối cảnh thiếu kiến thức trước. Báo cáo này đầu tiên chứng minh lợi ích của việc thu thập exome multiplex (hợp nhất các mẫu trước khi thu thập), sau đó trình bày một thuật toán phát hiện mới, mcCNV (“biến thể số lượng bản sao thu thập multiplex”), được xây dựng dựa trên việc thu thập multiplex.

Kết quả

Chúng tôi chứng minh: (1) thu thập multiplex giảm độ biến thiên giữa các mẫu; (2) phương pháp mcCNV của chúng tôi, một thuật toán dựa trên độ sâu mới cho việc phát hiện CNVs từ dữ liệu ES thu thập multiplex, cải thiện việc phát hiện các CNV nhỏ. Chúng tôi so sánh cách tiếp cận mới của mình, không phụ thuộc vào thông tin trước, với ExomeDepth thường được sử dụng. Trong một nghiên cứu mô phỏng, mcCNV đã chứng minh tỷ lệ phát hiện sai (FDR) thuận lợi. Khi so sánh với các kết quả từ giải trình tự gen tương ứng, chúng tôi nhận thấy thuật toán mcCNV hoạt động tương đương với ExomeDepth.

Kết luận

Việc triển khai thu thập multiplex tăng khả năng phát hiện CNVs của exon đơn. Thuật toán mcCNV mới có thể cung cấp tỷ lệ phát hiện sai (FDR) thuận lợi hơn so với ExomeDepth. Những lợi ích lớn nhất từ cách tiếp cận của chúng tôi xuất phát từ (1) không yêu cầu một cơ sở dữ liệu mẫu tham chiếu và (2) không yêu cầu thông tin trước về sự phổ biến hoặc kích thước của các biến thể.

Từ khóa

