Cấu trúc của các khối haplotype trong hệ gen người

American Association for the Advancement of Science (AAAS) - Tập 296 Số 5576 - Trang 2225-2229 - 2002
Stacey Gabriel1, S. F. Schaffner1, Huy Nguyen1, Jamie Moore1, Jessica Roy1, Brendan Blumenstiel1, John M. Higgins1, Matthew DeFelice1, Amy L. Lochner1, Maura Faggart1, Shau Neen Liu-Cordero2,1, Charles N. Rotimi3, Adebowale Adeyemo4, Richard Cooper5, Ryk Ward6, Eric S. Lander2,1, Mark J. Daly1, David Green7,8,1
1Whitehead/MIT Center for Genome Research, Cambridge, MA 02139, USA.
2Department of Biology, Massachusetts Institute of Technology, Cambridge, MA 02142, USA
3National Human Genome Center, Howard University, Washington, DC, 20059, USA
4Department of Pediatrics, College of Medicine, University of Ibadan, Ibadan, Nigeria.
5Department of Preventive Medicine and Epidemiology, Loyola University Medical School, Maywood, IL 60143, USA.
6Institute of Biological Anthropology, University of Oxford, Oxford, England OX2 6QS.
7Departments of Genetics and Medicine, Harvard Medical School,
8Departments of Genetics and Medicine, Harvard Medical School; Department of Molecular Biology and Diabetes Unit, Massachusetts General Hospital, Boston, MA 02114, USA.

Tóm tắt

Các phương pháp dựa trên haplotype cung cấp một tiếp cận mạnh mẽ trong định vị gene gây bệnh, dựa trên liên kết giữa các đột biến gây bệnh và các haplotype tổ tiên mà chúng phát sinh. Là một phần của Dự án Tần số Allele của Tổ hợp SNP, chúng tôi đặc trưng hóa các mô hình haplotype qua 51 vùng tự động (tổng cộng 13 megabases của hệ gen người) ở mẫu từ châu Phi, châu Âu, và châu Á. Chúng tôi chỉ ra rằng hệ gen người có thể được phân tích một cách khách quan thành các khối haplotype: những vùng rộng lớn mà ở đó có rất ít bằng chứng về tái tổ hợp lịch sử và trong đó chỉ quan sát được một vài haplotype thông thường. Các ranh giới của các khối và các haplotype cụ thể chứa trong chúng có mối tương quan cao giữa các quần thể. Chúng tôi chứng minh rằng các cấu trúc khung haplotype như vậy cung cấp sức mạnh thống kê đáng kể trong các nghiên cứu liên kết về biến thể di truyền phổ biến trên mỗi vùng. Kết quả của chúng tôi cung cấp cơ sở cho việc xây dựng bản đồ haplotype của hệ gen người, tạo điều kiện thuận lợi cho các nghiên cứu liên kết di truyền toàn diện về bệnh nhân."

Từ khóa

#haplotype #gene mapping #genetic variation #human genome #SNP Consortium #association studies #recombination #haplotype blocks

Tài liệu tham khảo

10.1126/science.274.5287.536

10.1126/science.278.5343.1580

10.1126/science.273.5281.1516

R. Sachidanandam et al. Nature 409 928 (2001).

J. C. Venter et al. Science 291 1304 (2001).

10.1038/85776

E. G. Puffenberger et al. Cell 79 1257 (1994).

B. Kerem et al. Science 245 1073 (1989).

J. Hastbacka et al. Nature Genet. 2 204 (1992).

J. D. Rioux et al. Nature Genet. 29 223 (2001).

J. P. Hugot et al. Nature 411 599 (2001).

Y. Ogura et al. Nature 411 603 (2001).

10.1086/321275

10.1101/gr.144500

10.1038/76980

10.1038/ng1001-229

10.1038/ng1001-217

N. Patil et al. Science 294 1719 (2001).

G. C. Johnson et al. Nature Genet. 29 233 (2001).

Materials and methods are available as supporting material on Science Online.

K. Tang et al. Proc. Natl. Acad. Sci. U.S.A. 96 10016 (1999).

Though 82% of assays were successful in at least one population genotyping success rates in each population range from 72 to 79%. The difference between these numbers is due to a low rate of laboratory failure in each attempt.

L. L. Cavalli-Sforza P. Menozzi A. Piazza The History and Geography of Human Genes (Princeton University Press Princeton NJ 1994).

10.1093/genetics/49.1.49

An upper confidence bound of 0.98 was used instead of 1.0 because even a single observation of a fourth haplotype makes it mathematically impossible for D′ to be consistent with a value of 1.0 though the confidence interval could be arbitrarily close to 1.0.

D. E. Reich et al. Nature 411 199 (2001).

As a further test of the model we simulated the proportion of pairs at a fixed distance (5 kb) that should show evidence of crossing block boundaries (that is show strong evidence of historical recombination). The model predicts these proportions to be 47% (Yoruban and African-American samples) and 27% (European and Asian samples). In the empirical data we observe 42 and 23% similar to these predictions.

A low rate of genotyping error is critical to obtaining an accurate measure of haplotype diversity and the proportion in common haplotypes. Even a modest (1 to 2%) genotyping error will create a substantial number of false rare haplotypes; for example with a 10-marker haplotype and a 2% error rate 18% of chromosomes will contain at least one error and thus not match the few common haplotypes.

Within blocks the common haplotypes showed little evidence for historical recombination. For example we performed the four gamete tests using SNPs drawn only from haplotypes with frequency 5% or higher in each block. One or more violations of the four gamete tests were observed in only 5% of the blocks.

To maximize power these comparisons were made only for SNP pairs spaced 5 to 10 kb apart. At shorter distances nearly all SNP pairs are in a single block; at greater distances most SNP pairs are in different blocks.

Blocks and haplotypes were identified separately in each population sample and the results were compared for those blocks that were physically overlapping in all three samples.

10.1093/genetics/106.3.479

10.1126/science.3125610

10.1073/pnas.95.14.8119

10.1038/35047064

S. A. Tishkoff et al. Science 271 1380 (1996).

S. A. Tishkoff et al. Am. J. Hum. Genet. 67 901 (2000).

We examined SNP pairs that were in different blocks in the Yoruban samples but in a single block in the European sample. Such pairs had higher D′ values in the Yoruban sample (D′ = 0.46) than pairs found in different blocks in both population samples (D′ = 0.28). The average frequency of all haplotypes in the Yoruban population was 0.21 whereas those that were found only in the Yoruban sample (but not in the European and Asian samples) had a mean frequency of 0.16.

A. G. Clark et al. Am. J. Hum. Genet. 63 595 (1998).

A. R. Templeton et al. Am. J. Hum. Genet. 66 69 (2000).

S. M. Fullerton et al. Am. J. Hum. Genet. 67 881 (2000).

The small fraction of SNPs that show r 2 values <0.5 could be attributable to a range of causes: branches of the gene tree not defined with the number of markers used gene conversion events or recurrent mutations. We note that errors in genotyping or map position decrease (but cannot increase) the value of r 2 .

This work was supported by a grant to D.A. from The SNP Consortium. We thank members of the Program in Medical and Population Genetics at the Whitehead/MIT Center for Genome Research for helpful discussion particularly J. Hirschhorn D. Reich and N. Patterson. The authors also thank the following colleagues for sharing data and analyses before publication: D. Bentley (Sanger Institute); L. Cardon (Oxford); and D. Cutler M. Zwick and A. Chakravarti (Johns Hopkins). D.A. is a Charles E. Culpeper Scholar of the Rockefeller Brothers Fund and a Burroughs Welcome Fund Clinical Scholar in Translational Research. Supporting Online Material www.sciencemag.org/cgi/content/full/1069424/DC1 Materials and Methods Figs. S1 to S3 Table S1