Bioinformatics
Công bố khoa học tiêu biểu
* Dữ liệu chỉ mang tính chất tham khảo
Summary: Gene duplication occurs via different modes such as segmental and single-gene duplications. Transposed gene duplication, a specific form of single-gene duplication, ‘copies’ a gene from an ancestral chromosomal location to a novel location. MCScanX is a toolkit for detection and evolutionary analysis of gene colinearity. We have developed MCScanX-transposed, a software package to detect transposed gene duplications that occurred within different epochs, based on execution of MCScanX within and between related genomes. MCScanX-transposed can be also used for integrative analysis of gene duplication modes for a genome and to annotate a gene family of interest with gene duplication modes.
Availability: MCScanX-transposed is freely available at http://chibba.pgml.uga.edu/mcscan2/transposed/.
Contact: [email protected] or [email protected]
Supplementary information: Supplementary data are available at Bioinformatics online.
Tóm lược: Nghiên cứu trong vài năm qua đã tiết lộ cấu trúc haplotype đáng kể trong bộ gen người. Việc mô tả các mẫu hình này, đặc biệt trong bối cảnh các nghiên cứu liên kết di truyền y học, đang trở thành một hoạt động nghiên cứu thường xuyên. Haploview là một gói phần mềm cung cấp tính toán các thống kê mất cân bằng liên kết cũng như các mẫu haplotype quần thể từ dữ liệu kiểu gen gốc trong một giao diện trực quan và tương tác.
Khả dụng: http://www.broad.mit.edu/mpg/haploview/
Liên hệ: [email protected]
Motivation: As improved DNA sequencing techniques have increased enormously the speed of producing new eukaryotic genome assemblies, the further development of automated gene prediction methods continues to be essential.
While the classification of proteins into families is a task heavily relying on correct gene predictions, it can at the same time provide a source of additional information for the prediction, complementary to those presently used.
Results: We extended the gene prediction software AUGUSTUS by a method that employs block profiles generated from multiple sequence alignments as a protein signature to improve the accuracy of the prediction. Equipped with profiles modelling human dynein heavy chain (DHC) proteins and other families, AUGUSTUS was run on the genomic sequences known to contain members of these families. Compared with AUGUSTUS' ab initio version, the rate of genes predicted with high accuracy showed a dramatic increase.
Availability: The AUGUSTUS project web page is located at http://augustus.gobics.de, with the executable program as well as the source code available for download.
Contact: [email protected]; [email protected]
Supplementary information: Supplementary data are available at Bioinformatics online.
Tóm tắt: Dự kiến các công nghệ biểu hiện gen số (DGE) mới nổi sẽ vượt qua công nghệ chip vi thể trong tương lai gần cho nhiều ứng dụng trong gen học chức năng. Một trong những nhiệm vụ phân tích dữ liệu cơ bản, đặc biệt cho các nghiên cứu biểu hiện gen, liên quan đến việc xác định liệu có bằng chứng cho thấy sự khác biệt ở số lượng của một bản sao hoặc exon giữa các điều kiện thí nghiệm hay không. edgeR là một gói phần mềm Bioconductor dùng để kiểm tra sự biểu hiện khác biệt của dữ liệu đếm lặp lại. Một mô hình Poisson phân tán quá mức được sử dụng để tính đến cả tính biến thiên sinh học và kỹ thuật. Các phương pháp Bayes thực nghiệm được sử dụng để điều chỉnh mức độ phân tán quá mức giữa các bản sao, cải thiện độ tin cậy của suy diễn. Phương pháp này có thể được sử dụng ngay cả với các mức độ lặp lại tối thiểu, miễn là ít nhất một kiểu hình hoặc điều kiện thí nghiệm được lặp lại. Phần mềm này còn có thể có các ứng dụng khác ngoài dữ liệu giải trình tự, chẳng hạn như dữ liệu số lượng peptide proteome.
Khả năng truy cập: Gói này có sẵn miễn phí theo giấy phép LGPL từ trang web Bioconductor (http://bioconductor.org).
Liên lạc: [email protected]
Động lực: Mặc dù đã có nhiều công cụ xử lý dữ liệu đọc từ giải trình tự thế hệ mới (NGS), chúng tôi vẫn không tìm thấy công cụ nào hoặc sự kết hợp của các công cụ đáp ứng yêu cầu của chúng tôi về tính linh hoạt, khả năng xử lý chính xác dữ liệu cặp đầu và hiệu suất cao. Chúng tôi đã phát triển Trimmomatic như một công cụ xử lý dữ liệu đầu vào linh hoạt và hiệu quả hơn, có khả năng xử lý chính xác dữ liệu cặp đầu.
Kết quả: Giá trị của việc xử lý dữ liệu đọc NGS đã được chứng minh cả trong các tác vụ dựa trên tham chiếu và không dựa trên tham chiếu. Trimmomatic cho thấy sản phẩm đầu ra ít nhất là ngang bằng, và trong nhiều trường hợp còn vượt trội hơn, so với các công cụ khác trong tất cả các kịch bản đã được kiểm nghiệm.
Tính khả dụng và triển khai: Trimmomatic được cấp phép theo GPL V3. Công cụ này có thể chạy trên nhiều nền tảng (cần Java 1.5+) và có sẵn tại http://www.usadellab.org/cms/index.php?page=trimmomatic
Liên hệ: [email protected]
Thông tin bổ sung: Dữ liệu bổ sung có sẵn trực tuyến tại Bioinformatics.
AmiGO là một ứng dụng web cho phép người dùng truy vấn, duyệt và trực quan hóa các ngữ nghĩa học và dữ liệu ghi chú sản phẩm gen liên quan (liên kết). AmiGO có thể được sử dụng trực tuyến tại trang web Gene Ontology (GO) để truy cập dữ liệu do Liên minh GO cung cấp; nó cũng có thể được tải xuống và cài đặt để duyệt ngữ nghĩa học và ghi chú địa phương. AmiGO là một phần mềm mã nguồn mở được phát triển và duy trì bởi Liên minh GO.
Khả dụng: http://amigo.geneontology.org
Tải về: http://sourceforge.net/projects/geneontology/
Liên hệ: [email protected]
Tóm lược: ClustalW là một công cụ để căn chỉnh nhiều chuỗi protein hoặc nucleotide. Việc căn chỉnh này được thực hiện thông qua ba bước: căn chỉnh từng cặp, tạo cây hướng dẫn và căn chỉnh tiến dần. ClustalW-MPI là một triển khai phân tán và song song của ClustalW. Cả ba bước đều đã được thực hiện song song để giảm thời gian thực hiện. Phần mềm sử dụng một thư viện truyền thông điệp gọi là MPI (Giao diện Truyền thông Điệp) và chạy trên các cụm máy trạm phân tán cũng như trên các máy tính song song truyền thống.
Khả dụng: Mã nguồn được viết bằng ISO C và có tại http://www.bii.a-star.edu.sg/software/clustalw-mpi/. Một triển khai mã nguồn mở của MPI có tại http://www-unix.mcs.anl.gov/mpi/.
Liên hệ: [email protected]
Tóm tắt: Chương trình MRBAYES thực hiện suy luận Bayes của phả hệ bằng cách sử dụng một biến thể của thuật toán Monte Carlo chuỗi Markov.
Khả dụng: MRBAYES, bao gồm mã nguồn, tài liệu, các tệp dữ liệu mẫu và một tệp thực thi, có sẵn tại http://brahms.biology.rochester.edu/software.html.
Liên hệ: [email protected]
- 1
- 2
- 3
- 4
- 5
- 6
- 10