Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
So sánh các dự đoán chú thích cho Affymetrix GeneChips®
Tóm tắt
Chúng tôi đã so sánh các chú thích của Affymetrix và Bioconductor cho bảng GeneChip® MOE430A (chuột). Việc ánh xạ các bộ đầu dò đến các định danh LocusLink (LocusIDs) được phát hiện là động, với nhiều thay đổi giữa các phiên bản chú thích liên tiếp của cả Affymetrix và Bioconductor. Có 49 bộ đầu dò được chỉ định cho một LocusID bởi Affymetrix và cho một LocusID khác bởi Bioconductor từ giữa năm 2004 trở đi. Đối với hầu hết các ví dụ này, chú thích của Affymetrix được xác định là phù hợp với dự đoán gen hiện tại. Các định danh chuỗi tham chiếu (RefSeq) được coi là tiêu chuẩn vàng của các chú thích. Tuy nhiên, chúng tôi không thể sử dụng những định danh này để phân biệt độ chính xác của Bioconductor và Affymetrix vì không phải tất cả các đầu dò đều ánh xạ đến chuỗi RefSeq mà bộ đầu dò đó được chỉ định. Hơn nữa, trong một số trường hợp, các đầu dò vẫn nằm ở vùng phía hạ lưu của đầu 3′ của một chuỗi RefSeq. Các gen liền kề được phát hiện là nguyên nhân chính gây ra các khác biệt giữa các chỉ định của Bioconductor và Affymetrix. Các nghiên cứu trường hợp của một số bộ đầu dò cho thấy rằng các chỉ định không chính xác là do các chỉ định của cụm UniGene của các thẻ trình tự biểu hiện đại diện cho các bộ đầu dò, và do các lỗi trong chuỗi GenBank®. Các kết quả của chúng tôi chỉ ra rằng vẫn còn một số lỗi tồn tại trong các nguồn chú thích được sử dụng bởi cộng đồng vi mạch.
Từ khóa
#Microarray; Affymetrix; Bioconductor; Gene annotation; LocusIDs; RefSeqTài liệu tham khảo
Affymetrix, Inc. GeneChip® Custom Express™ array design guide: part no. 700506 rev. 4 [online]. Available from URL: http://www.affymetrix.com/support/technical/other/custom_design_manual.pdf [Accessed 2006 Sep 27]
Affymetrix, Inc. Array design and performance of the GeneChip® mouse expression set 430: technical note, part no. 701405 Rev. 1 [online]. Available from URL: http://www.affymetrix.com/support/technical/technotes/mouse430_technote.pdf [Accessed 2006 Oct 9]
GenBank® [online]. Available from URL: http://www.ncbi.nlm.nih.gov/Genbank/index.html [Accessed 2006 Sep 26]
NCBI expressed sequence tags database [online]. Available from URL: http://www.ncbi.nlm.nih.gov/dbEST/ [Accessed 2006 Sep 26]
NCBI reference sequences [online]. Available from URL: http://www.ncbi.nlm.nih.gov/RefSeq [Accessed 2006 Sep 26]
NCBI UniGene [online]. Available from URL: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?.db=unigene [Accessed 2006 Sep 26]
Affymetrix, Inc. Array design for the GeneChip® human genome U133 set: technical note, part no. 701133 rev. 1 [online]. Available from URL: http://www.affymetrix.com/support/technical/technotes/hgu133_design_technote.pdf [Accessed 2006 Oct 9]
Pruitt KD, Maglott DR. RefSeq and LocusLink: NCBI gene-centered resources. Nucleic Acids Res 2001; 29: 137–40
Maglott D, Ostell J, Pruitt KD, et al. Entrez Gene: gene-centred information at NCBI. Nucleic Acids Res 2005; 33 (database issue): D54–8
Pontius JU, Wagner L, Schuler GD. UniGene: a unified view of the transcriptome. In: The NCBI handbook, 2003 [online]. Available from URL: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=handbook.chapter.ch21 [Accessed 2006 Oct 10]
Liu G, Loraine AE, Shigeta R, et al. NetAffx: Affymetrix probesets and annotations. Nucleic Acids Res 2003; 31: 82–6
Affymetrix, Inc. Transcript assignment for Affymetrix GeneChip® probe arrays [online]. Available from URL: http://www.affymetrix.com/support/technical/whitepapers/netaffxannot_whitepaper.pdf [Accessed 2006 Sep 27]
Kent WJ. BLAT: the BLAST-like alignment tool. Genome Res 2002; 12: 656–64
Gentleman RC, Carey VJ, Bates DM, et al. Bioconductor: open software development for computational biology and bioinformatics. Genome Biol 2004; 5(10): R80
Zhang J. Basic functions of AnnBuilder [online]. Available from URL: http://www.bioconductor.org/repository/devel/vignette/AnnBuilder.pdf [Accessed 2006 Sep 27]
Zhang, J. How to use AnnBuilder [online]. Available from URL: http://www.bioconductor.org/repository/devel/vignette/ABPrimer.pdf [Accessed 2006 Sep 27]
Mouse Genome Sequencing Consortium. Initial sequencing and comparative analysis of the mouse genome. Nature 2002; 420: 520–62
UCSC Genome Bioinformatics [online]. Available from URL: http://genome.ucsc.edu [Accessed 2006 Sep 26]
Kent WJ, Sugnet CW, Furey TS, et al. The human genome browser at UCSC. Genome Res 2002; 12: 996–1006
Karolchik D, Baertsch R, Diekhans M, et al. The UCSC genome browser database. Nucleic Acids Res 2003; 31: 51–4
Ensembl [online]. Available from URL: http://www.ensembl.org/index.html [Accessed 2006 Sep 26]
Hubbard T, Andrews D, Caccamo M, et al. Ensembl 2005. Nucleic Acids Res 2005; 33 (database issue): D447–53
Interface AffyProbe [online]. Available from URL: http://www.ensembl.org/info/software/java/api/org/ensembl/datamodel/AffyProbe.html [Accessed 2006 Oct 11]
Affymetrix. Mouse expression set 430 [online]. Available from URL: http://www.affymetrix.com/support/technical/byproduct.affx?product=moe430 [Accessed 2006 Oct 10]
Affymetrix. Rat expression set 230 [online]. Available from URL: http://www.affymetrix.com/support/technical/byproduct.affx?product=rae230 [Accessed 2006 Oct 10]
NetAffx analysis center [online]. Available from URL: http://www.affymetrix.com/analysis/index.affx [Accessed 2006 Oct 10]
Ihaka R, Gentleman R. R: a language for data analysis and graphics. Journal of Computational and Graphical Statistics 1996; 5: 299–314
NCBI Map Viewer [online]. Available from URL: http://www.ncbi.nlm.nih.gov/mapview [Accessed 2006 Sep 26]
NCBI UniGene FAQ [online]. Available from URL: http://www.ncbi.nlm.nih.gov/UniGene/FAQ.shtml [Accessed 2006 Sep 27]
Ensembl. Microarray probeset mapping [online]. Available from URL: http://www.ensembl.org/info/data/docs/microarray_probe_set_mapping.html [Accessed 2006 Oct 16]
Perez-Iratxeta C, Andrade MA. Inconsistencies over time in 5% of NetAffx probeto-gene annotations. BMC Bioinformatics 2005; 6: 183
Harbig J, Sprinkle R, Enkemann SA. A sequence-based identification of the genes detected by probesets on the Affymetrix U133 plus 2.0 array. Nucleic Acids Res 2005; 33: e31