edgeR: một gói Bioconductor cho phân tích biểu hiện khác biệt của dữ liệu biểu hiện gen số
Tóm tắt
Tóm tắt: Dự kiến các công nghệ biểu hiện gen số (DGE) mới nổi sẽ vượt qua công nghệ chip vi thể trong tương lai gần cho nhiều ứng dụng trong gen học chức năng. Một trong những nhiệm vụ phân tích dữ liệu cơ bản, đặc biệt cho các nghiên cứu biểu hiện gen, liên quan đến việc xác định liệu có bằng chứng cho thấy sự khác biệt ở số lượng của một bản sao hoặc exon giữa các điều kiện thí nghiệm hay không. edgeR là một gói phần mềm Bioconductor dùng để kiểm tra sự biểu hiện khác biệt của dữ liệu đếm lặp lại. Một mô hình Poisson phân tán quá mức được sử dụng để tính đến cả tính biến thiên sinh học và kỹ thuật. Các phương pháp Bayes thực nghiệm được sử dụng để điều chỉnh mức độ phân tán quá mức giữa các bản sao, cải thiện độ tin cậy của suy diễn. Phương pháp này có thể được sử dụng ngay cả với các mức độ lặp lại tối thiểu, miễn là ít nhất một kiểu hình hoặc điều kiện thí nghiệm được lặp lại. Phần mềm này còn có thể có các ứng dụng khác ngoài dữ liệu giải trình tự, chẳng hạn như dữ liệu số lượng peptide proteome.
Khả năng truy cập: Gói này có sẵn miễn phí theo giấy phép LGPL từ trang web Bioconductor (http://bioconductor.org).
Liên lạc: [email protected]
Từ khóa
Tài liệu tham khảo
Andersson, 2008, Comparative analysis of human gut microbiota by barcoded pyrosequencing, PLoS ONE, 3, e2836, 10.1371/journal.pone.0002836
Gentleman, 2004, Bioconductor: open software development for computational biology and bioinformatics, Genome Biol., 5, R80, 10.1186/gb-2004-5-10-r80
Li, 2008, Determination of tag density required for digital transcriptome analysis: application to an androgen-sensitive prostate cancer model, Proc. Natl Acad. Sci. USA, 105, 20179, 10.1073/pnas.0807121105
Marioni, 2008, RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays, Genome Res., 18, 1509, 10.1101/gr.079558.108
Robinson, 2007, Moderated statistical tests for assessing differences in tag abundance, Bioinformatics, 23, 2881, 10.1093/bioinformatics/btm453
Robinson, 2008, Small sample estimation of negative binomial dispersion, with applications to SAGE data, Biostatistics, 9, 321, 10.1093/biostatistics/kxm030
Smyth, 2004, Linear models and empirical Bayes methods for assessing differential expression in microarray experiments, Stat. Appl. Genet. Mol. Biol., 1
Smyth, 1996, A conditional approach to residual maximum likelihood estimation in generalized linear models, J. R. Stat. Soc. B, 58, 565