Kiểm định Kolmogorov-Smirnov có dấu: tại sao nó không nên được sử dụng

Oxford University Press (OUP) - Tập 4 - Trang 1-3 - 2015
Guillaume J Filion1,2
1Genome Architecture, Gene Regulation, Stem Cells and Cancer Programme, Centre for Genomic Regulation (CRG), Barcelona, Spain
2Universitat Pompeu Fabra (UPF), Barcelona, Spain

Tóm tắt

Kiểm định Kolmogorov-Smirnov (KS) hai mẫu thường được sử dụng để quyết định xem hai mẫu ngẫu nhiên có phân phối thống kê giống nhau hay không. Một biến thể phổ biến của kiểm định KS là sử dụng phiên bản có dấu của thống kê KS để suy luận xem giá trị của một mẫu có lớn hơn về mặt thống kê so với giá trị của mẫu còn lại hay không. Các giả thuyết cơ bản của kiểm định KS về bản chất là không tương thích với phương pháp này và kiểm định có thể tạo ra các kết quả dương tính giả với sự hỗ trợ của giá trị p cực kỳ thấp. Điều này có thể khiến kiểm định KS có dấu trở thành một công cụ gây rối p (p-hacking), điều này nên được khuyến nghị tránh bằng cách thay thế nó bằng các kiểm định tiêu chuẩn như kiểm định t và bằng cách cung cấp khoảng tin cậy thay vì giá trị p.

Từ khóa

#Kiểm định Kolmogorov-Smirnov #kiểm định thống kê #p-hacking #giá trị p #kiểm định t #khoảng tin cậy

Tài liệu tham khảo

Lara-Astiaso D, Weiner A, Lorenzo-Vivas E, Zaretsky I, Jaitin DA, David E, et al. Chromatin state dynamics during blood formation. Science. 2014;345:943–9. Winter EE, Goodstadt L, Ponting CP. Elevated rates of protein secretion, evolution, and disease among tissue-specific genes. Genome Res. 2004;14:54–61. Al-Shahrour F, Minguez P, Tárraga J, Medina I, Alloza E, Montaner D, et al. FatiGO +: a functional profiling tool for genomic data. Integration of functional annotation, regulatory motifs and interaction data with microarray experiments. Nucleic Acids Res. 2007;35 Web Server Issue:W91-6. Stark KL, Xu B, Bagchi A, Lai WS, Liu H, Hsu R, et al. Altered brain microRNA biogenesis contributes to phenotypic deficits in a 22q11-deletion mouse model. Nat Genet. 2008;40:751–60. Landan G, Cohen NM, Mukamel Z, Bar A, Molchadsky A, Brosh R, et al. Epigenetic polymorphism and the stochastic formation of differentially methylated regions in normal and cancerous tissues. Nat Genet. 2012;44:1207–14. Heinz S, Benner C, Spann N, Bertolino E, Lin YC, Laslo P, et al. Simple combinations of lineage-determining transcription factors prime cis-regulatory elements required for macrophage and B cell identities. Mol Cell. 2010;38:576–89.