edgeR: một gói Bioconductor cho phân tích biểu hiện khác biệt của dữ liệu biểu hiện gen số

Bioinformatics - Tập 26 Số 1 - Trang 139-140 - 2010
Mark D. Robinson1, Davis J. McCarthy1, Gordon K. Smyth1
11 Cancer Program, Garvan Institute of Medical Research, 384 Victoria Street, Darlinghurst, NSW 2010 and 2 Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research, 1G Royal Parade, Parkville, Victoria 3052, Australia

Tóm tắt

Tóm tắt

Tóm tắt: Dự kiến các công nghệ biểu hiện gen số (DGE) mới nổi sẽ vượt qua công nghệ chip vi thể trong tương lai gần cho nhiều ứng dụng trong gen học chức năng. Một trong những nhiệm vụ phân tích dữ liệu cơ bản, đặc biệt cho các nghiên cứu biểu hiện gen, liên quan đến việc xác định liệu có bằng chứng cho thấy sự khác biệt ở số lượng của một bản sao hoặc exon giữa các điều kiện thí nghiệm hay không. edgeR là một gói phần mềm Bioconductor dùng để kiểm tra sự biểu hiện khác biệt của dữ liệu đếm lặp lại. Một mô hình Poisson phân tán quá mức được sử dụng để tính đến cả tính biến thiên sinh học và kỹ thuật. Các phương pháp Bayes thực nghiệm được sử dụng để điều chỉnh mức độ phân tán quá mức giữa các bản sao, cải thiện độ tin cậy của suy diễn. Phương pháp này có thể được sử dụng ngay cả với các mức độ lặp lại tối thiểu, miễn là ít nhất một kiểu hình hoặc điều kiện thí nghiệm được lặp lại. Phần mềm này còn có thể có các ứng dụng khác ngoài dữ liệu giải trình tự, chẳng hạn như dữ liệu số lượng peptide proteome.

Khả năng truy cập: Gói này có sẵn miễn phí theo giấy phép LGPL từ trang web Bioconductor (http://bioconductor.org).

Liên lạc: [email protected]

Từ khóa


Tài liệu tham khảo

Andersson, 2008, Comparative analysis of human gut microbiota by barcoded pyrosequencing, PLoS ONE, 3, e2836, 10.1371/journal.pone.0002836

Gentleman, 2004, Bioconductor: open software development for computational biology and bioinformatics, Genome Biol., 5, R80, 10.1186/gb-2004-5-10-r80

Li, 2008, Determination of tag density required for digital transcriptome analysis: application to an androgen-sensitive prostate cancer model, Proc. Natl Acad. Sci. USA, 105, 20179, 10.1073/pnas.0807121105

Marioni, 2008, RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays, Genome Res., 18, 1509, 10.1101/gr.079558.108

Robinson, 2007, Moderated statistical tests for assessing differences in tag abundance, Bioinformatics, 23, 2881, 10.1093/bioinformatics/btm453

Robinson, 2008, Small sample estimation of negative binomial dispersion, with applications to SAGE data, Biostatistics, 9, 321, 10.1093/biostatistics/kxm030

Smyth, 2004, Linear models and empirical Bayes methods for assessing differential expression in microarray experiments, Stat. Appl. Genet. Mol. Biol., 1

Smyth, 1996, A conditional approach to residual maximum likelihood estimation in generalized linear models, J. R. Stat. Soc. B, 58, 565

Wong, 2008, Computational methods for the comparative quantification of proteins in label-free LCn-MS experiments, Brief. Bioinform., 9, 156, 10.1093/bib/bbm046