Statistics in Medicine
Công bố khoa học tiêu biểu
* Dữ liệu chỉ mang tính chất tham khảo
This paper describes the use of the bootstrap,1,2 a new computer‐based statistical methodology, to help validate a regression model resulting from the fitting of Cox's proportional hazards model3 to a set of censored survival data. As an example, we define a prognostic model for outcome in childhood acute lymphocytic leukemia with the Cox model and use of a training set of 224 patients. To validate the accuracy of the model, we use a bootstrap resampling technique to mimic the population under study in two stages. First, we select the important prognostic factors via a stepwise regression procedure with 100 bootstrap samples. Secondly we estimate the corresponding regression parameters for these important factors with 400 bootstrap samples. The bootstrap result suggests that the model constructed from the training set is reasonable.
Nhiều lần ước lượng dữ liệu khuyết bằng phương trình xích là một cách tiếp cận linh hoạt và thiết thực để xử lý dữ liệu bị mất. Chúng tôi mô tả các nguyên tắc của phương pháp này và trình bày cách ước lượng dữ liệu cho các biến số phân loại và định lượng, bao gồm cả các biến số phân phối lệch. Chúng tôi đưa ra hướng dẫn về cách chỉ định mô hình ước lượng và số lần ước lượng cần thiết. Chúng tôi mô tả việc phân tích thực tế các dữ liệu đã được ước lượng nhiều lần, bao gồm cả quá trình xây dựng mô hình và kiểm tra mô hình. Chúng tôi nhấn mạnh những hạn chế của phương pháp và thảo luận các khả năng gặp phải sai lầm. Chúng tôi minh họa các ý tưởng bằng một bộ dữ liệu trong lĩnh vực sức khỏe tâm thần, kèm theo các đoạn mã Stata. Bản quyền © 2010 John Wiley & Sons, Ltd.
Các nghiên cứu dịch tễ học quan sát thường gặp nhiều xung đột tiềm ẩn, từ nhiễu đồng biến và do mối nhân quả ngược, điều này hạn chế khả năng xác định mạnh mẽ mối quan hệ nhân quả của chúng. Đã có nhiều tình huống nổi bật trong đó các thử nghiệm kiểm soát ngẫu nhiên của chính xác các can thiệp đã được khảo sát trong các nghiên cứu quan sát đã cho ra kết quả khác biệt rõ rệt. Trong các lĩnh vực khoa học quan sát khác, việc sử dụng các phương pháp biến công cụ (IV - Instrumental Variable) là một phương án tiếp cận để củng cố các suy luận nhân quả trong các tình huống không thực nghiệm. Sử dụng các biến đổi gen mầm uỷ để làm các công cụ cho các tiếp xúc có thể điều chỉnh môi trường là một dạng phân tích IV có thể thực hiện trong các nghiên cứu dịch tễ học quan sát. Phương pháp này được gọi là 'hoán vị Mendel', và có thể được coi như tương tự với các thử nghiệm kiểm soát ngẫu nhiên. Bài viết này giới thiệu phương pháp hoán vị Mendel, làm nổi bật sự tương đồng với các phương pháp IV, cung cấp ví dụ về việc thực hiện phương pháp này và thảo luận các hạn chế của phương pháp cũng như một số phương pháp để giải quyết những vấn đề này. Bản quyền © 2007 John Wiley & Sons, Ltd.
In survival analysis, a competing risk is an event whose occurrence precludes the occurrence of the primary event of interest. Outcomes in medical research are frequently subject to competing risks. In survival analysis, there are 2 key questions that can be addressed using competing risk regression models: first, which covariates affect the rate at which events occur, and second, which covariates affect the probability of an event occurring over time. The cause‐specific hazard model estimates the effect of covariates on the rate at which events occur in subjects who are currently event‐free. Subdistribution hazard ratios obtained from the Fine‐Gray model describe the relative effect of covariates on the subdistribution hazard function. Hence, the covariates in this model can also be interpreted as having an effect on the cumulative incidence function or on the probability of events occurring over time. We conducted a review of the use and interpretation of the Fine‐Gray subdistribution hazard model in articles published in the medical literature in 2015. We found that many authors provided an unclear or incorrect interpretation of the regression coefficients associated with this model. An incorrect and inconsistent interpretation of regression coefficients may lead to confusion when comparing results across different studies. Furthermore, an incorrect interpretation of estimated regression coefficients can result in an incorrect understanding about the magnitude of the association between exposure and the incidence of the outcome. The objective of this article is to clarify how these regression coefficients should be reported and to propose suggestions for interpreting these coefficients.
Prediction performance of a risk scoring system needs to be carefully assessed before its adoption in clinical practice. Clinical preventive care often uses risk scores to
Interest in targeted disease prevention has stimulated development of models that assign risks to individuals, using their personal covariates. We need to evaluate these models and quantify the gains achieved by expanding a model to include additional covariates. This paper reviews several performance measures and shows how they are related. Examples are used to show that appropriate performance criteria for a risk model depend upon how the model is used. Application of the performance measures to risk models for hypothetical populations and for US women at risk of breast cancer illustrate two additional points. First, model performance is constrained by the distribution of risk‐determining covariates in the population. This complicates the comparison of two models when applied to populations with different covariate distributions. Second, all summary performance measures obscure model features of relevance to its utility for the application at hand, such as performance in specific subgroups of the population. In particular, the precision gained by adding covariates to a model can be small overall, but large in certain subgroups. We propose new ways to identify these subgroups and to quantify how much they gain by measuring the additional covariates. Those with largest gains could be targeted for cost‐efficient covariate assessment. Copyright © 2010 John Wiley & Sons, Ltd.
Missing data is a common complication in data analysis. In many medical settings missing data can cause difficulties in estimation, precision and inference. Multiple imputation (MI) (
Most randomized clinical trials require periodic monitoring of the accumulating data. While the efficiency of trial management is enhanced by data monitoring, ethical reasons should primarily dictate the need to terminate or change a trial in response to interim findings.
This article focuses on the ethical dilemma of when to stop a clinical trial and places statistical stopping rules in the context of such ethical decision making. Other issues include the organization of data monitoring committees and the problems of premature publication and exaggerated estimation in trials that stop early. Several topical examples are used to convey the relevance of these issues to current practice.
- 1
- 2
- 3
- 4
- 5
- 6
- 10