Phân tích làm giàu bộ gen: Phương pháp dựa trên tri thức để diễn giải hồ sơ biểu hiện gen toàn bộ hệ gen

Aravind Subramanian1, Pablo Tamayo1, Vamsi K. Mootha1, Sayan Mukherjee1, Benjamin L. Ebert1, Michael A. Gillette1, Amanda G. Paulovich1, Scott L. Pomeroy1, Todd R. Golub1, Eric S. Lander1, Jill P. Mesirov1
1Broad Institute of Massachusetts Institute of Technology and Harvard, 320 Charles Street, Cambridge, MA 02141;Department of Systems Biology, Alpert 536, Harvard Medical School, 200 Longwood Avenue, Boston, MA 02446; Institute for Genome Sciences and Policy, Center for Interdisciplinary Engineering, Medicine, and Applied Sciences, Duke University, 101 Science Drive, Durham, NC 27708; Department of Medical Oncology, Dana–Farber Cancer Institute, 44 Binney Street, Boston, MA 02115; Division of...

Tóm tắt

Mặc dù phân tích biểu hiện RNA toàn bộ hệ gen đã trở thành một công cụ thường xuyên trong nghiên cứu y sinh, việc rút ra hiểu biết sinh học từ thông tin đó vẫn là một thách thức lớn. Tại đây, chúng tôi mô tả một phương pháp phân tích mạnh mẽ gọi là Phân tích Làm giàu Bộ gen (GSEA) để diễn giải dữ liệu biểu hiện gen. Phương pháp này đạt được sức mạnh của nó bằng cách tập trung vào các bộ gen, tức là các nhóm gen chia sẻ chức năng sinh học chung, vị trí nhiễm sắc thể hoặc sự điều hòa. Chúng tôi chứng minh cách GSEA cung cấp những hiểu biết sâu sắc vào một số tập dữ liệu liên quan đến ung thư, bao gồm bệnh bạch cầu và ung thư phổi. Đáng chú ý, trong khi phân tích từng gen cho thấy ít giống nhau giữa hai nghiên cứu độc lập về sự sống sót của bệnh nhân ung thư phổi, GSEA lại tiết lộ nhiều con đường sinh học chung. Phương pháp GSEA được hiện thực hóa trong một gói phần mềm miễn phí, cùng với một cơ sở dữ liệu ban đầu gồm 1.325 bộ gen định nghĩa sinh học.

Từ khóa

#RNA biểu hiện toàn bộ hệ gen; GSEA; bộ gen; ung thư; bệnh bạch cầu; phân tích ứng dụng; hồ sơ biểu hiện

Tài liệu tham khảo

10.1126/science.270.5235.467

10.1038/nbt1296-1675

10.1126/science.1086384

10.1038/ng1180

10.1073/pnas.1032913100

10.1056/NEJMoa031314

Hollander M. & Wolfe D. A. ( 1999) Nonparametric Statistical Methods (Wiley New York).

10.1016/S0166-4328(01)00297-2

10.1093/bioinformatics/btf877

10.1016/S0092-8674(03)00570-1

10.1038/nature03441

10.1146/annurev.genet.36.042902.092433

10.1073/pnas.96.25.14440

10.1159/000071572

10.1002/humu.10081

10.1038/ng765

10.1073/pnas.94.13.6948

Barbouti, A., Hoglund, M., Johansson, B., Lassen, C., Nilsson, P. G., Hagemeijer, A., Mitelman, F. & Fioretos, T. ( 2003) Cancer Res. 63, 1202–1206. 12649177

10.1038/sj.leu.2401482

10.1038/sj.onc.1205573

10.1016/S0268-960X(03)00040-7

10.1073/pnas.191502998

10.1038/nm733

10.1073/pnas.241500798

10.1038/ncb985

10.1007/s00109-002-0355-1

10.1128/MCB.22.15.5575-5584.2002

10.1158/1078-0432.CCR-0629-3

Monti, S., Savage, K. J., Kutok, J. L., Feuerhake, F., Kurtin, P., Mihm, M., Wu, B., Pasqualucci, L., Neuberg, D., Aguiar, R. C., et al. ( 2004) Blood 105, 1851–1861. 15550490

10.1038/nm1052

10.1038/ng1490

10.1186/gb-2003-4-1-r7

10.2165/00822942-200403040-00009

10.1093/bioinformatics/btg363