
Genetics
SCOPUS (1945-1951,1961-2023)SCIE-ISI
1943-2631
0016-6731
Mỹ
Cơ quản chủ quản: Oxford University Press , GENETICS SOCIETY AMERICA
Các bài báo tiêu biểu
Chúng tôi mô tả một phương pháp phân nhóm dựa trên mô hình để sử dụng dữ liệu genotype đa locus nhằm suy diễn cấu trúc dân số và phân bổ cá thể vào các quần thể. Chúng tôi giả định một mô hình trong đó có K quần thể (K có thể không được biết), mỗi quần thể được đặc trưng bởi một tập hợp các tần số allele tại mỗi locus. Các cá thể trong mẫu được phân bổ (về mặt xác suất) vào các quần thể, hoặc chung vào hai hoặc nhiều quần thể nếu kiểu gen của chúng cho thấy rằng chúng là lai tạp. Mô hình của chúng tôi không giả định một quy trình đột biến cụ thể, và nó có thể được áp dụng cho hầu hết các dấu hiệu gen di truyền thường được sử dụng, với điều kiện là chúng không liên kết chặt chẽ với nhau. Các ứng dụng của phương pháp chúng tôi bao gồm việc chứng minh sự hiện diện của cấu trúc dân số, phân bổ cá thể vào các quần thể, nghiên cứu các vùng lai tạp, và xác định những cá thể di cư và lai tạp. Chúng tôi cho thấy phương pháp này có thể tạo ra các phân bổ cực kỳ chính xác với việc sử dụng số lượng locus khiêm tốn—ví dụ, bảy locus microsatellite trong một ví dụ sử dụng dữ liệu genotype từ một loài chim nguy cấp. Phần mềm được sử dụng cho bài báo này có sẵn tại http://www.stats.ox.ac.uk/~pritch/home.html.
Các phương pháp được mô tả để tách biệt, bổ sung và lập bản đồ các đột biến của Caenorhabditis elegans, một loài giun tròn sống tự do nhỏ. Khoảng 300 đột biến được kích thích bởi EMS ảnh hưởng đến hành vi và hình thái đã được xác định và khoảng một trăm gen đã được phân định. Các đột biến trong 77 trong số này làm thay đổi chuyển động của động vật. Các ước tính về tần suất đột biến do kích thích cả đột biến có thể quan sát được và đột biến gây chết trên nhiễm sắc thể X gợi ý rằng, giống như ở Drosophila, các đơn vị di truyền trong C.elegans là lớn.
Chúng tôi trình bày một khung nghiên cứu về sự biến đổi phân tử trong một loài. Dữ liệu về sự khác biệt giữa các haplotype DNA đã được tích hợp vào một định dạng phân tích phương sai, xuất phát từ ma trận khoảng cách bình phương giữa tất cả các cặp haplotype. Phân tích phương sai phân tử (AMOVA) này cung cấp các ước tính về thành phần phương sai và các đồng vị thống kê F, được gọi là phi-statistics, phản ánh sự tương quan của độ đa dạng haplotype ở các cấp độ phân chia thứ bậc khác nhau. Phương pháp này khá linh hoạt để thích ứng với các ma trận đầu vào thay thế, tương ứng với các loại dữ liệu phân tử khác nhau, cũng như các giả định tiến hóa khác nhau, mà không làm thay đổi cấu trúc cơ bản của phân tích. Ý nghĩa của các thành phần phương sai và phi-statistics được kiểm định bằng cách tiếp cận hoán vị, loại bỏ giả định về chuẩn tính thông thường trong phân tích phương sai nhưng không phù hợp cho dữ liệu phân tử. Áp dụng AMOVA cho dữ liệu haplotype DNA ty thể của con người cho thấy, sự phân chia dân số được giải quyết tốt hơn khi một số biện pháp khác biệt phân tử giữa các haplotype được đưa vào phân tích. Tuy nhiên, ở cấp độ nội bộ loài, thông tin bổ sung từ việc biết quan hệ phân loại chính xác giữa các haplotype hoặc thông qua việc dịch phi tuyến thay đổi vị trí hạn chế thành độ đa dạng nucleotide không làm thay đổi đáng kể cấu trúc di truyền dân số suy luận. Các nghiên cứu Monte Carlo cho thấy việc lấy mẫu vị trí không ảnh hưởng căn bản tới ý nghĩa của các thành phần phương sai phân tử. Việc xử lý AMOVA dễ dàng mở rộng theo nhiều hướng khác nhau và cấu thành một khung hợp lý và linh hoạt cho việc phân tích thống kê dữ liệu phân tử.
Bài báo này nghiên cứu mối quan hệ giữa hai ước lượng biến đổi di truyền ở cấp độ DNA, cụ thể là số lượng vị trí phân ly và số lượng khác biệt nucleotide trung bình được ước lượng từ so sánh cặp. Kết quả cho thấy mối tương quan giữa hai ước lượng này lớn khi kích thước mẫu nhỏ và giảm dần khi kích thước mẫu tăng lên. Dựa trên mối quan hệ thu được, một phương pháp thống kê để kiểm tra giả thuyết đột biến trung tính được phát triển. Phương pháp này chỉ cần dữ liệu về đa hình DNA, cụ thể là sự biến đổi di truyền trong quần thể ở cấp độ DNA. Một phương pháp mô phỏng máy tính đơn giản, được sử dụng để thu được phân phối của một thống kê mới được phát triển, cũng sẽ được trình bày. Áp dụng phương pháp thống kê này cho năm vùng trình tự DNA ở Drosophila melanogaster, kết quả cho thấy sự chèn/xóa lớn (lớn hơn 100 bp) là có hại. Điều này cho thấy rằng chọn lọc tự nhiên chống lại sự chèn/xóa lớn là rất yếu, do đó một lượng lớn biến đổi vẫn được duy trì trong một quần thể.
Độ lớn của các sai lệch hệ thống liên quan đến độ đa hình di truyền của mẫu và khoảng cách di truyền của mẫu được đánh giá, và các công thức để thu được các ước lượng không thiên lệch về độ đa hình di truyền trung bình và khoảng cách di truyền được phát triển. Nó cũng được chỉ ra rằng số lượng cá thể được sử dụng để ước tính độ đa hình di truyền trung bình có thể rất nhỏ nếu một số lượng lớn loci được nghiên cứu và độ đa hình di truyền trung bình là thấp. Số lượng cá thể được sử dụng để ước tính khoảng cách di truyền cũng có thể rất nhỏ nếu khoảng cách di truyền lớn và độ đa hình di truyền trung bình của hai loài so sánh là thấp.
Một loạt vector chuyển nấm men và chủng đã được tạo ra nhằm cho phép thao tác DNA hiệu quả hơn trong Saccharomyces cerevisiae. Các vector thay thế đã được xây dựng và sử dụng để tạo ra các chủng nấm men chứa các đột biến không chuyển đổi his3, trp1, leu2 và ura3. Một bộ vector YCp và YIp (dòng pRS) sau đó được thực hiện dựa trên nền của plasmid đa mục đích pBLUESCRIPT. Các vector pRS này có cấu trúc đồng nhất và chỉ khác nhau ở gen chọn lọc của nấm men được sử dụng (HIS3, TRP1, LEU2 và URA3). Chúng sở hữu tất cả các đặc điểm của pBLUESCRIPT và một số đặc tính cụ thể của nấm men. Sử dụng vector pRS, người ta có thể thực hiện hầu hết các thao tác DNA tiêu chuẩn trong cùng một plasmid đã được đưa vào nấm men.
Chúng tôi mô tả các cải tiến đối với phương pháp của Pritchard và cộng sự để suy diễn cấu trúc dân số từ dữ liệu genotype đa locus. Quan trọng nhất, chúng tôi phát triển các phương pháp cho phép có sự liên kết giữa các loci. Mô hình mới này xem xét các mối tương quan giữa các loci liên kết phát sinh trong các quần thể trộn lẫn (“mất cân bằng liên kết trộn lẫn”). Sự điều chỉnh này có một số lợi thế, cho phép (1) phát hiện các sự kiện trộn lẫn xa hơn vào quá khứ, (2) suy diễn quần thể nguồn gốc của các vùng nhiễm sắc thể, và (3) ước lượng chính xác hơn về sự không chắc chắn thống kê khi sử dụng các loci liên kết. Nó cũng có thể hữu ích cho việc lập bản đồ trộn lẫn. Thêm vào đó, chúng tôi mô tả một mô hình prior mới cho tần số allele trong mỗi quần thể, cho phép xác định các phân chia quần thể tinh tế mà không thể phát hiện được khi sử dụng phương pháp hiện có. Chúng tôi trình bày các kết quả áp dụng các phương pháp mới để nghiên cứu trộn lẫn ở người Mỹ gốc Phi, tái tổ hợp trong Helicobacter pylori, và trôi dạt trong các quần thể Drosophila melanogaster. Các phương pháp này được triển khai trong một chương trình, structure, phiên bản 2.0, có sẵn tại http://pritch.bsd.uchicago.edu.
Mục đích chính của bài báo này là trình bày một số kiểm định thống kê mới về tính trung lập của các đột biến chống lại một lớp mô hình thay thế, trong đó các đa hình DNA có xu hướng thể hiện sự dư thừa của các alen hiếm hoặc các đột biến trẻ. Mục đích khác là nghiên cứu sức mạnh của các kiểm định hiện có và các kiểm định mới phát triển, cũng như xem xét chi tiết mô hình đa hình dưới ảnh hưởng của sự tăng trưởng dân số, hiện tượng hitchhiking di truyền và lựa chọn nền. Kết quả cho thấy rằng các mô hình đa hình trong một mẫu DNA dưới sự tăng trưởng dân số logistic và hiện tượng hitchhiking di truyền rất giống nhau và một trong các kiểm định mới phát triển, FS, mạnh hơn nhiều so với các kiểm định hiện có trong việc bác bỏ giả thuyết về tính trung lập của các đột biến. Lựa chọn nền tạo ra các mô hình đa hình hoàn toàn khác với sự tăng trưởng dân số logistic hoặc hiện tượng hitchhiking di truyền, mặc dù tất cả chúng đều cho thấy sự dư thừa của các alen hiếm hoặc các đột biến trẻ. Chúng tôi chỉ ra rằng các kiểm định của Fu và Li là một trong những kiểm định mạnh nhất chống lại lựa chọn nền. Các hệ quả của những kết quả này sẽ được thảo luận.
Các tiến bộ gần đây trong các kỹ thuật di truyền phân tử sẽ cung cấp bản đồ dấu hiệu dày và việc định kiểu nhiều cá thể cho các dấu hiệu này trở nên khả thi. Tại đây, chúng tôi đã cố gắng ước lượng hiệu ứng của khoảng 50.000 haplotype dấu hiệu đồng thời từ một số lượng hồ sơ phenotypic hạn chế. Một bộ gen dài 1000 cM đã được mô phỏng với khoảng cách dấu hiệu là 1 cM. Các dấu hiệu xung quanh mỗi vùng 1-cM được kết hợp thành haplotype dấu hiệu. Do kích thước quần thể hữu hạn (Ne = 100), các haplotype dấu hiệu ở trạng thái không cân bằng liên kết với QTL nằm giữa các dấu hiệu. Sử dụng phương pháp bình phương tối thiểu, tất cả các hiệu ứng haplotype không thể được ước lượng đồng thời. Khi chỉ bao gồm các hiệu ứng lớn nhất, chúng được ước lượng cao hơn và độ chính xác trong việc dự đoán giá trị di truyền của con cái từ các động vật đã ghi nhận chỉ đạt 0.32. Dự đoán tốt nhất không thiên lệch về hiệu ứng haplotype giả định sự đồng nhất về phương sai liên quan đến mỗi đoạn nhiễm sắc thể 1-cM, điều này mang lại độ chính xác 0.73, mặc dù giả định này không gần đúng. Các phương pháp Bayes giả định một phân phối trước của phương sai liên quan đến mỗi đoạn nhiễm sắc thể đã tăng độ chính xác này lên 0.85, ngay cả khi phân phối trước không đúng. Kết luận rằng việc chọn lọc dựa trên giá trị di truyền được dự đoán từ các dấu hiệu có thể làm tăng đáng kể tỷ lệ thu được di truyền ở động vật và cây trồng, đặc biệt nếu kết hợp với các kỹ thuật sinh sản để rút ngắn khoảng thời gian sinh sản.