Dữ liệu giải trình tự gen, phiên mã và epi-gen của dòng tế bào bạch cầu REH

Springer Science and Business Media LLC - Tập 16 - Trang 1-5 - 2023
Mariya Lysenkova Wiklander1, Elin Övernäs1, Johanna Lagensjö1, Amanda Raine1, Anna Petri2, Ann-Christin Wiman1, Jon Ramsell1, Yanara Marincevic-Zuniga1, Henrik Gezelius1, Tom Martin1, Ignas Bunikis2, Sara Ekberg1, Rikard Erlandsson1, Pontus Larsson1, Mai-Britt Mosbech2, Susana Häggqvist2, Susanne Hellstedt Kerje2, Lars Feuk2, Adam Ameur2, Ulrika Liljedahl1, Jessica Nordlund1
1Department of Medical Sciences and Science for Life Laboratory, Uppsala University, Uppsala, Sweden
2Department of Immunology, Genetics and Pathology and Science for Life Laboratory, Uppsala University, Uppsala, Sweden

Tóm tắt

Mục tiêu của bài báo dữ liệu này là mô tả một bộ sưu tập gồm 33 tập dữ liệu giải trình tự gen, phiên mã và epi-gen của dòng tế bào bạch cầu cấp tính lymphoblastic (ALL) REH. REH là một trong những dòng tế bào thường được sử dụng nhất cho các nghiên cứu chức năng về ALL ở trẻ em, và dữ liệu này cung cấp một đặc điểm phân tích đa chiều về các đặc tính phân tử của nó. Các tập dữ liệu được mô tả ở đây, được tạo ra bằng công nghệ giải trình tự ngắn và dài, không chỉ cung cấp cái nhìn sâu sắc vào kiểu gen bất thường phức tạp của REH, mà còn có thể được sử dụng làm tập dữ liệu tham chiếu để đánh giá chất lượng dữ liệu giải trình tự hoặc để phát triển các phương pháp. Bài báo này mô tả 33 tập dữ liệu tương ứng với 867 gigabase dữ liệu giải trình tự thô được tạo ra từ dòng tế bào REH. Các tập dữ liệu này bao gồm năm phương pháp khác nhau cho giải trình tự toàn bộ genome (WGS) trên bốn nền tảng giải trình tự, hai kỹ thuật giải trình tự RNA (RNA-seq) trên hai nền tảng giải trình tự khác nhau, giải trình tự methyl hóa DNA, và giải trình tự ATAC đơn bào.

Từ khóa

#dòng tế bào REH #bạch cầu cấp tính lymphoblastic #dữ liệu giải trình tự #giải trình tự RNA #methyl hóa DNA #giải trình tự ATAC

Tài liệu tham khảo

Gillet J-P, Varma S, Gottesman MM. The clinical relevance of Cancer Cell Lines. JNCI J Natl Cancer Inst. 2013;105:452–8. Gazdar AF, Minna JD. Cell lines as an investigational tool for the study of biology of small cell lung cancer. Eur J Cancer Clin Oncol. 1986;22:909–11. Rosenfeld C, Goutner A, Choquet C, Venuat AM, Kayibanda B, Pico JL, et al. Phenotypic characterisation of a unique non-T, non-B acute lymphoblastic leukaemia cell line. Nature. 1977;267:841–3. Cortes JE, Kantarjian HM. Acute lymphoblastic leukemia a comprehensive review with emphasis on biology and therapy. Cancer. 1995;76:2393–417. Raine A, Manlig E, Wahlberg P, Syvänen A-C, Nordlund J. SPlinted Ligation Adapter Tagging (SPLAT), a novel library preparation method for whole genome bisulphite sequencing. Nucleic Acids Res. 2017;45:e36–6. Shyr D, Liu Q. Next generation sequencing in cancer research and clinical application. Biol Proced Online. 2013;15:4. LeBlanc VG, Marra MA. Next-generation sequencing approaches in Cancer: where have they brought us and where will they take us? Cancers. 2015;7:1925–58. Sakamoto Y, Sereewattanawoot S, Suzuki A. A new era of long-read sequencing for cancer genomics. J Hum Genet. 2020;65:3–10. Rausch T, Snajder R, Leger A, Simovic M, Giurgiu M, Villacorta L, et al. Long-read sequencing of diagnosis and post-therapy medulloblastoma reveals complex rearrangement patterns and epigenetic signatures. Cell Genomics. 2023;3:100281. Fang LT, Zhu B, Zhao Y, Chen W, Yang Z, Kerrigan L, et al. Establishing community reference samples, data and call sets for benchmarking cancer mutation detection using whole-genome sequencing. Nat Biotechnol. 2021;39:1151–60. Ren L, Duan X, Dong L, Zhang R, Yang J, Gao Y et al. Quartet DNA reference materials and datasets for comprehensively evaluating germline variants calling performance. preprint. Bioinformatics; 2022. Lysenkova Wiklander M, Arvidsson G, Bunikis I, Lundmark A, Raine A, Marincevic-Zuniga Y et al. A complete digital karyotype of the B-cell leukemia REH cell line resolved by long-read sequencing. preprint. Cancer Biology; 2023. Lysenkova Wiklander M. REH Data Note - Overview of REH sequencing datasets. 2023. https://doi.org/10.6084/m9.figshare.23966340. Accessed 16 Aug 2023. Lysenkova Wiklander M. REH Data Note - Supplemental Methods.pdf. 2023. https://doi.org/10.6084/M9.FIGSHARE.22643065. Accessed 11 May 2023. Lysenkova Wiklander M. REH Data Note - Data File 3. Short Tandem Repeat Analysis of the REH cell line. 2023. https://doi.org/10.6084/m9.figshare.24131670 NCBI Sequence Read Archive. WGS of REH (Illumina TruSeq DNA PCR-Free) - Illumina HiSeq X - Lane 1. 2023. https://identifiers.org/insdc.sra:SRR10882610 NCBI Sequence Read Archive. WGS of REH (Illumina TruSeq DNA PCR-Free) - Illumina HiSeq X - Lane 2. 2023. https://identifiers.org/insdc.sra:SRR10882609 NCBI Sequence Read Archive. WGS of REH (Illumina TruSeq DNA PCR-Free) - mapped - hg38. 2023. https://identifiers.org/insdc.sra:SRR23704824 NCBI Sequence Read Archive. CLR WGS of REH (PacBio SMRT). 2023. https://identifiers.org/insdc.sra:SRR22805329 NCBI Sequence Read Archive. HiFi WGS of REH (PacBio SMRT). 2023. https://identifiers.org/insdc.sra:SRR19123265 NCBI Sequence Read Archive. HiFi/CLR WGS of REH (PacBio SMRT) - mapped - hg38. 2023. https://identifiers.org/insdc.sra:SRR23704823 NCBI Sequence Read Archive. De-novo REH assembly (hifiasm, PacBio HiFi and CLR WGS). 2023. https://identifiers.org/insdc.sra:SRR23704827 NCBI Sequence Read Archive. ONT WGS of REH, sheared to 10 kb. 2023. https://identifiers.org/insdc.sra:SRR22730978 NCBI Sequence Read Archive. ONT WGS of REH, sheared to 20 kb. 2023. https://identifiers.org/insdc.sra:SRR22444744 NCBI Sequence Read Archive. ONT WGS of REH, sheared to 30 kb. 2023. https://identifiers.org/insdc.sra:SRR23054498 NCBI Sequence Read Archive. ONT WGS of REH, sheared to 60 kb, size selected with Circulomics SRE. 2023. https://identifiers.org/insdc.sra:SRR22444743 NCBI Sequence Read Archive. ONT WGS of REH, size selected with Circulomics SRE. 2023. https://identifiers.org/insdc.sra:SRR22444742 NCBI Sequence Read Archive. ONT WGS of REH, Ultralong. 2023. https://identifiers.org/insdc.sra:SRR21147769 NCBI Sequence Read Archive. ONT WGS of REH, Ultralong - mapped - hg38. 2023. https://identifiers.org/insdc.sra:SRR23704822 NCBI Sequence Read Archive. De-novo REH assembly (flye/medaka, ONT Ultralong WGS). 2023. https://identifiers.org/insdc.sra:SRR23704826 NCBI Sequence Read Archive. De-novo REH assembly (flye/racon, ONT Ultralong and PacBio WGS). 2023. https://identifiers.org/insdc.sra:SRR23704825 NCBI Sequence Read Archive. MGISEQ WGS of REH (stLFR). 2023. https://identifiers.org/insdc.sra:SRR18907774 NCBI Sequence Read Archive. 10x GemCode linked-read WGS of REH (high molecular weight) - mapped - hg37. 2023. https://identifiers.org/insdc.sra:SRR10902121 NCBI Sequence Read Archive. 10x GemCode linked-read WGS of REH (standard DNA) - mapped - hg37. 2023. https://identifiers.org/insdc.sra:SRR10902122 NCBI Sequence Read Archive. Single cell ATAC sequencing of REH (10x Chromium) – 1 of 4. 2023. https://identifiers.org/insdc.sra:SRR22320001 NCBI Sequence Read Archive. Single cell ATAC sequencing of REH (10x Chromium) – 2 of 4. 2023. https://identifiers.org/insdc.sra:SRR22320000 NCBI Sequence Read Archive. Single cell ATAC sequencing of REH (10x Chromium) – 3 of 4. 2023. https://identifiers.org/insdc.sra:SRR22319999 NCBI Sequence Read Archive. Single cell ATAC sequencing of REH (10x Chromium) – 4 of 4. 2023. https://identifiers.org/insdc.sra:SRR22319998 NCBI Sequence Read Archive. Single-cell ATAC sequencing of REH - Illumina NovaSeq 6000 - mapped - hg38. 2023. https://identifiers.org/insdc.sra:SRR10907069 NCBI Sequence Read Archive. EM-seq of REH (NEBNext) – 100ng DNA. 2023. https://identifiers.org/insdc.sra:SRR23020114 NCBI Sequence Read Archive. EM-seq of REH (NEBNext) – 10ng DNA. 2023. https://identifiers.org/insdc.sra:SRR23020113 NCBI Sequence Read Archive. RNA-seq of REH (Illumina TruSeq stranded total RNA) - Illumina NovaSeq 6000 - Lane 1. 2023. https://identifiers.org/insdc.sra:SRR10882846 NCBI Sequence Read Archive. RNA-seq of REH (Illumina TruSeq stranded total RNA) - Illumina NovaSeq 6000 - Lane 2. 2023. https://identifiers.org/insdc.sra:SRR10882845 NCBI Sequence Read Archive. RNA-seq of REH (Illumina TruSeq stranded total RNA) - mapped - hg38. 2023. https://identifiers.org/insdc.sra:SRR23704830 NCBI Sequence Read Archive. HiFi RNA-seq of REH (PacBio IsoSeq) - standard-length transcripts. 2023. https://identifiers.org/insdc.sra:SRR22729869 NCBI Sequence Read Archive. HiFi RNA-seq of REH (PacBio IsoSeq) - long transcripts. 2023. https://identifiers.org/insdc.sra:SRR22729868 NCBI Sequence Read Archive. HiFi RNA-seq of REH (PacBio IsoSeq) - standard-length transcripts - FLNC and mapped - hg38. 2023. https://identifiers.org/insdc.sra:SRR23704829 NCBI Sequence Read Archive. HiFi RNA-seq of REH (PacBio IsoSeq) - long transcripts - FLNC and mapped - hg38. 2023. https://identifiers.org/insdc.sra:SRR23704828