Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Giảm chiều trong mô hình tuyến tính cho dữ liệu bị kiểm định bên phải: Dự đoán sự thay đổi của mức độ RNA HIV-I sử dụng dữ liệu lâm sàng và đột biến gen protease
Tóm tắt
Với sự phát triển nhanh chóng trong công nghệ đo lường các đặc tính bệnh lý ở mức độ phân tử hoặc di truyền, hiện nay có thể thu thập một lượng lớn dữ liệu về nhiều yếu tố dự đoán tiềm năng cho kết quả lâm sàng quan tâm trong nghiên cứu y tế. Thông tin về một số lượng lớn các yếu tố dự đoán thường được sử dụng hiệu quả để dự đoán kết quả mà các nhà nghiên cứu quan tâm. Nhiều công cụ thống kê đã được phát triển để vượt qua những khó khăn do không gian biến cố có chiều cao trong bối cảnh của mô hình hồi quy tuyến tính. Bài báo này tập trung vào tình huống, nơi mà các kết quả quan tâm bị kiểm định bên phải. Chúng tôi đã thực hiện phương pháp bình phương tối thiểu mở rộng cùng với các phương pháp thường được sử dụng khác để phân tích các yếu tố biến cố có chiều cao với tập dữ liệu ACTG333. Đặc biệt, chúng tôi so sánh hiệu suất dự đoán của các phương pháp khác nhau thông qua các nghiên cứu xác thực chéo rộng rãi. Kết quả cho thấy rằng giá trị dự đoán của mô hình bình phương tối thiểu dựa trên Buckley–James, lựa chọn mô hình theo từng bước và hồi quy theo thành phần chính có sức mạnh dự đoán tương tự đầy hứa hẹn và phương pháp bình phương tối thiểu có một số lợi thế về khả năng giải thích và tính toán số học.
Từ khóa
#giảm chiều #hồi quy tuyến tính #dữ liệu bị kiểm định bên phải #RNA HIV-I #đột biến gen proteaseTài liệu tham khảo
J. Buckley I. James (1979) ArticleTitleLinear regression with censored data Biometrika 66 429–436
A. Collier R. Coombs D. Schoenfeld R. Bassett J. Timpone A. Baruch M. Jones K. Facey C. Whitacre V. McAuliffe H. Friedman T. Merigan R. Reichman C. Hooper L. Corey (1996) ArticleTitleTreatment of human immunodeficiency virus infection with saquinavir, zidovudine, and zalcitabine:AIDS Clinical Trial Group N. Engl. J. Med. 16 1011–1017
J. Condra W. Schleif O. Blahy L. Gabryelski D. Graham J. Quintero A. Rhodes H. Robbins E. Roth M. Shivaprakash D. Titus T. Yang H. Tepplert K. Squires P. Deutsch E. Emini (1995) ArticleTitleIn vivo emergence of HIV-I variants resistant to multiple protease inhibitors Nature 374 569–571
J. Condra D. Holder W. Schleif et al. (1996) ArticleTitleGenetic correlates of in vivo viral resistance to indinavir, a human immunodeficiency virus type I protease inhibitor J. Virol. 70 8270–8276
D. Cox (1972) ArticleTitleRegression models and life tables J. Roy. Stat. Soc., Ser. B 34 187–220
N Draper H. Smith (1981) Applied Regression Analysis Wiley New York
I. Helland (1988) ArticleTitleOn the structure of partial least squares regression Commun. Stat. Simu. Comp. 17 581–607
R. Hocking (1976) ArticleTitleThe analysis and selection of variables in linear regression Biometrics 32 1–49
H. Hotelling, ‘‘Analysis of a complex of statistical variables into principal components’’, J. Edu. Psychol. vol. 24 pp. 417–441, 489–520, 1933.
J. Hughes (1999) ArticleTitleMixed effects models with censored data with applications to HIV RNA levels Biometrics 55 625–629
J. Huang and D. Harrington, ‘‘Iterative partial least squares with right-censored data analysis: A comparision to other dimension reduction technique,’’ Biometrics, 2005.
H. Jacobsen M. Hanggi M. Ott I. Duncan S. Owen M. Andreoni S. Vella J. Mous (1996) ArticleTitleIn vivo resistance to a human immunodeficiency virus type I protease inhibitor:Mutations, kinetics, and frequencies J. Inf. Dis. 173 1379–1387
H. Jacqmin-Gadda R. Thiébaut (2000) ArticleTitleAnalysis of left censored longitudinal data with application to viral load in HIV infection Biostatistics 1 355–368
Z. Jin D. Lin L. Wei Z. Ying (2003) ArticleTitleRank-based inference for the accelerated failure time model Biometrika 90 341–353
I. Jolliffe (1986) Principal Component Analysis Springer-Verlag New York
N. Laird J. Ware (1982) ArticleTitleRandom effects models for longitudinal data Biometrics 38 963–974 Occurrence Handle1:STN:280:BiyC2sbhs1Q%3D Occurrence Handle7168798
I. Marschner R. Betensky V. Degruttola S. Hammer D. Kuritzkes (1999) ArticleTitleClinical trials using HIV-1 RNA-based primary endpoints statistical analysis and potential biases J. Acq. Imm. Def. Syndr. Hum. Retr. 20 220–227
A. r Mille (1990) Subset Selection in Regression Chapman and Hall London
D. Nguyen D. Rocke (2002) ArticleTitlePartial least squares proportional hazard regression for application to DNA microarray survival data Bioinformatics 18 1625–1632
M. Para D. Glidden R. Coombs A. Collier J. Condra C. Craig R. Bassett S. Leavitt V. McAuliffe C. Roucher (2000) ArticleTitleBaseline human immunodeficiency virus type I phenotype, genotype, and RNA response after switching from long-term hard-capsule saquinavir to indinavir or soft-gel-capsule in AIDS clinical trials group protocol 333 J. Inf. Dis. 182 733–743
P. Park L. Tian I. Kohane (2002) ArticleTitleLinking gene expression data with patient survival times using partial least squares Bioinformatics 18 S120–S127
M Stone R. Brooks (1990) and Cross-validation sequentially constructed prediction embracing ordinary least squares, partial least squares and principal components regression’’, J. Roy. Stat. Soc., Ser. B vol. 52 pp. 237–269 , ‘‘Continuum regression
R. Tibshirani (1996) ArticleTitleRegression shrinkage and selection via the lasso J. Roy. Stat. Soc., Ser. B 58 267–288
A. Tsiatis (1990) ArticleTitleEstimation regression parameters using linear rank tests for censored data model with censored data Ann. Stat. 18 354–372
M. Vaillancourt R. Irlbeck T. Smith R. Coombs R. Swanstrom (1999) ArticleTitleThe HIV type I protease inhibitor saquinavir can select for multiple mutations that confer increasing resistance’’, AIDS Res. Hum. Retr. 15 355–363
P. Wentzell L. Montot (2003) ArticleTitleComparison of prinicpal components regression and partial least squares through generic simulations of complex mixtures Chem. Intell. Lab. Syst. 65 257–279
H Wold (1966) Wold, ‘‘Nonlinear estimation by iterative least squares procedures’’, Research papers in Statistics: Festschrift for J. Neyman John Wiley and Sons New York 411–444
H. Wold, ‘‘Soft modeling by latent variables: The non-linear iterative partial least squares (NIPALS) approach,’’ Perspectives in Probability and Statistics, In Honor of M. S. Bartlett, Academic: New York, pp. 117--144, 1976.
S. Wold, H. Wold, W. Dunn, and A. Ruhe, ‘‘The collinearity problem in linear regression: The partial least squares (PLS) approach to generalized inverse,’’ SIAM J. Sci. Stat. Comput. vol. 5 pp. 735--743, 1984