Ước lượng autozygosity từ thông tin có độ sâu cao: ảnh hưởng của mật độ SNP và sai sót genotyping

Maja Ferenčaković1, Johann Sölkner2, Ino Čurik1
1Department of Animal Science, Faculty of Agriculture, University of Zagreb, Svetosimunska 25, 10000, Zagreb, Croatia
2Department of Sustainable Agricultural Systems, Division of Livestock Sciences, University of Natural Resources and Life Sciences Vienna, Gregor Mendel Str. 33, A-1180, Vienna, Austria

Tóm tắt

Tóm tắt Đặt vấn đề

Các đoạn đồng hợp tử là những đoạn genotypes đồng hợp tử dài, liên tục cho phép ước lượng đáng tin cậy mức độ consanguinity (tức là autozygosity) dựa trên genotypes SNP đơn nucleotide (SNP) sử dụng chip với độ sâu cao. Trong khi định nghĩa lý thuyết về các đoạn đồng hợp tử là trực tiếp, việc xác định thực nghiệm của chúng phụ thuộc vào loại chip SNP được sử dụng để thu thập dữ liệu và vào một số yếu tố, bao gồm số lượng các genotypes dị hợp tử cho phép để tính đến sai sót genotyping. Chúng tôi đã phân tích cách thức mật độ chip SNP và sai sót genotyping ảnh hưởng đến ước lượng autozygosity dựa trên các đoạn đồng hợp tử ở ba quần thể bò, sử dụng dữ liệu genotype từ một chip SNP với 777 972 SNP và một chip 50k.

Kết quả

Dữ liệu từ chip 50k dẫn đến việc ước lượng vượt mức số lượng các đoạn đồng hợp tử ngắn hơn 4 Mb, vì phân tích không thể xác định các SNP dị hợp tử hiện diện trên chip dày đặc hơn. Ngược lại, dữ liệu từ chip dày đặc hơn dẫn đến việc ước lượng thấp số lượng các đoạn đồng hợp tử dài hơn 8 Mb, trừ khi sự hiện diện của một số ít genotypes SNP dị hợp tử được cho phép trong một đoạn đồng hợp tử.

Kết luận

Chúng tôi đã cho thấy rằng mật độ chip SNP và sai sót genotyping giới thiệu các mẫu lệch trong việc ước lượng autozygosity dựa trên các đoạn đồng hợp tử. Các chip SNP với 50 000 đến 60 000 markers thường có sẵn cho các loài gia súc và thông tin của chúng dẫn đến một dự đoán bảo thủ về autozygosity từ các đoạn đồng hợp tử dài hơn 4 Mb. Không cho phép các genotypes SNP dị hợp tử hiện diện trong một đoạn đồng hợp tử, như đã được khuyến nghị cho các quần thể người, là không đủ cho các quần thể gia súc vì chúng có mức độ autozygosity cao hơn rất nhiều và do đó các đoạn đồng hợp tử dài hơn. Khi cho phép một số ít các genotypes dị hợp tử, phần mềm hiện tại không phân biệt giữa các tình huống mà các genotypes này ở gần nhau và do đó chỉ ra một sự phá vỡ thực sự của đoạn so với những tình huống mà chúng phân tán trên chiều dài của đoạn đồng hợp. Các bài kiểm tra đồ họa đơn giản được sử dụng trong bài báo này là một giải pháp hiện tại, nhưng tốn công sức.

Từ khóa


Tài liệu tham khảo

Gibson J, Morton NE, Collins A: Extended tracts of homozygosity in outbred human populations. Hum Mol Genet. 2006, 15: 789-795. 10.1093/hmg/ddi493.

Broman KW, Weber JL: Long homozygous chromosomal segments in reference families from the centre d’étude du polymorphisme humain. Am J Hum Genet. 1999, 65: 1493-1500. 10.1086/302661.

Kirin M, McQuillan R, Franklin CS, Campbell H, McKeigue PM, Wilson JF: Genomic runs of homozygosity record population history and consanguinity. PLoS One. 2010, 5: e13996-10.1371/journal.pone.0013996.

Keller MC, Visscher PM, Goddard ME: Quantification of inbreeding due to distant ancestors and its detection using dense SNP data. Genetics. 2011, 189: 237-249. 10.1534/genetics.111.130922.

Lencz T, Lambert C, DeRosse P, Burdick KE, Morgan TV, Kane JM, Kucherlapati R, Malhotra AK: Runs of homozygosity reveal highly penetrant recessive loci in schizophrenia. Proc Natl Acad Sci USA. 2007, 104: 19942-19947. 10.1073/pnas.0710021104.

Purfield DC, Berry DP, McParland S, Bradley DG: Runs of homozygosity and population history in cattle. BMC Genet. 2012, 13: 70-10.1186/1471-2156-13-70.

Ferenčaković M, Hamzic E, Gredler B, Curik I, Sölkner J: Runs of homozygosity reveal genome-wideautozygosity in the Austrian fleckvieh cattle. Agric Conspec Sci. 2011, 76: 325-328.

Ferenčaković M, Hamzić E, Gredler B, Solberg TR, Klemetsdal G, Curik I, Sölkner J: Estimates of autozygosity derived from runs of homozygosity: empirical evidence from selected cattle populations. J Anim Breed Genet. 2013, 130: 286-293. 10.1111/jbg.12012.

Bjelland DW, Weigel KA, Vukasinovic N, Nkrumah JD: Evaluation of inbreeding depression in Holstein cattle using whole-genome SNP markers and alternative measures of genomic inbreeding. J Dairy Sci. 2013, 96: 4697-4706. 10.3168/jds.2012-6435.

Silió L, Rodríguez MC, Fernández A, Barragán C, Benítez R, Óvilo C, Fernández AI: Measuring inbreeding and inbreeding depression on pig growth from pedigree or SNP-derived metrics. J Anim Breed Genet. 2013, 130: 349-360.

Howrigan DP, Simonson MA, Keller MC: Detecting autozygosity through runs of homozygosity: a comparison of three autozygosity detection algorithms. BMC Genomics. 2011, 12: 460-10.1186/1471-2164-12-460.

Albrechtsen A, Nielsen FC, Nielsen R: Ascertainment biases in SNP chips affect measures of population divergence. Mol Biol Evol. 2010, 27: 2534-2547. 10.1093/molbev/msq148.

Wigginton JE, Cutler DJ, Abecasis GR: A note on exact tests of Hardy-Weinberg equilibrium. Am J Hum Genet. 2005, 76: 887-893. 10.1086/429864.

Rabbee N, Speed TP: A genotype calling algorithm for affymetrix SNP arrays. Bioinformatics. 2006, 22: 7-12. 10.1093/bioinformatics/bti741.

Sölkner J, Filipcic L, Hampshire N: Genetic variability of populations and similarity of subpopulations in Austria cattle breeds determined by analysis of pedigrees. Anim Sci. 1998, 67: 249-256. 10.1017/S1357729800010006.

Purcell S, Neale B, Todd-Brown K, Thomas L, Ferreira MA, Bender D, Maller J, Sklar P, de Bakker PI, Daly MJ, Sham PC: PLINK: a toolset for whole-genome association and population-based linkage analysis. Am J Hum Genet. 2007, 81: 559-575. 10.1086/519795.

Powell JE, Visscher PM, Goddard ME: Reconciling the analysis of IBD and IBS in complex trait studies. Nat Rev Genet. 2010, 11: 800-805. 10.1038/nrg2865.

Leutenegger AL, Prum B, Genin E, Verny C, Lemainque A, Clerget-Darpoux F, Thompson EA: Estimation of the inbreeding coefficient through use of genomic data. Am J Hum Genet. 2003, 73: 516-523. 10.1086/378207.

SAS Institute Inc: SAS/STAT Software. 2011, Cary NC: SAS Institute Inc: Version 9.3

Holm S: A simple sequentially rejective multiple test procedure. Scand J Stat. 1979, 6: 65-70.

Esko T, Mezzavilla M, Nelis M, Borel C, Debniak T, Jakkula E, Julia A, Karachanak S, Khrunin A, Kisfali P, Krulisova V, Aušrelé Kučinskiené Z, Rehnström K, Traglia M, Nikitina-Zake L, Zimprich F, Antonarakis SE, Estivill X, Glavač D, Gut I, Klovins J, Krawczak M, Kučinskas V, Lathrop M, Macek M, Marsal S, Meitinger T, Melegh B, Limborska S, Lubinski J: Genetic characterization of northeastern Italian population isolates in the context of broader European genetic diversity. Eur J Hum Genet. 2013, 21: 659-665. 10.1038/ejhg.2012.229.

Zhang L, Orloff MS, Reber S, Li S, Zhao Y, Eng C: cgaTOH: extended approach for identifying tracts of homozygosity. PLoS One. 2013, 8: e57772-10.1371/journal.pone.0057772.

Nothnagel M, Lu TT, Kayser M, Krawczak M: Genomic and geographic distribution of SNP-defined runs of homozygosity in Europeans. Hum Mol Genet. 2010, 19: 2927-2935. 10.1093/hmg/ddq198.

Pemberton TJ, Absher D, Feldman MW, Myers RM, Rosenberg NA, Li JZ: Genomic patterns of homozygosity in worldwide human populations. Am J Hum Genet. 2012, 91: 275-292. 10.1016/j.ajhg.2012.06.014.