Environmetrics
Công bố khoa học tiêu biểu
* Dữ liệu chỉ mang tính chất tham khảo
Việc phân chia môi trường thành các vùng mà có vẻ như chứa đựng nội dung sinh học tương tự là hữu ích để điều tra các câu hỏi về phân bố và sinh cảnh, đồng thời giúp hướng dẫn việc bảo tồn và sử dụng tài nguyên. Nhiệm vụ thống kê này yêu cầu liên kết dữ liệu hiện diện/vắng mặt từ nhiều loài với dữ liệu môi trường có cùng vị trí. Trong bài báo này, chúng tôi giới thiệu một khuôn khổ mô hình hóa thống kê mà mô hình hóa môi trường như một tập hợp các vùng, nơi mà vector xác suất quan sát một tập hợp các loài vẫn giữ nguyên tương đối trong một vùng và riêng biệt giữa các vùng khác nhau. Điều này được thực hiện trong khuôn khổ mô hình hỗn hợp các chuyên gia, mà coi loại vùng là một biến ẩn có phân phối biến đổi theo chức năng của môi trường. Cách tiếp cận này cho phép chúng tôi dự đoán xác suất của các loại vùng cho các vị trí đã lấy mẫu và chưa lấy mẫu. Mô hình tổng hợp dữ liệu sinh học và môi trường, kết hợp cả hai trong một xác suất duy nhất cho phép truyền đạt sự không chắc chắn qua toàn bộ mô hình. Phương pháp này được chứng minh bằng một ví dụ tổng hợp và dữ liệu từ một cuộc khảo sát cá từ Bờ Tây Bắc, nằm ngoài khơi Tây Úc. Một gói R, RCPmod, triển khai các phương pháp được mô tả trong bài báo này, đã có sẵn từ CRAN. Bản quyền © 2013 John Wiley & Sons, Ltd.
Nghiên cứu hỏa địa toàn cầu là rất cần thiết để thông tin cho các đánh giá tác động của biến đổi khí hậu được sử dụng cho quản lý và ra quyết định. Khí hậu là một yếu tố tác động mạnh mẽ đến các mô hình không gian và tạm thời của hỏa hoạn, khiến cho sự thay đổi khí hậu đang diễn ra dự kiến sẽ thay đổi hoạt động hỏa hoạn toàn cầu. Số lượng ngày càng tăng các phân tích thống kê - tương quan khảo sát các yếu tố môi trường của các mô hình hỏa hoạn toàn cầu hiện tại hoặc diện tích cháy, nhưng rất ít nghiên cứu đặt ra các câu hỏi quan trọng “nếu có” về tiềm năng tương lai của hỏa hoạn dưới các kịch bản của biến đổi khí hậu. Do đó, mục tiêu của chúng tôi là thu hút cộng đồng thống kê rộng lớn hơn tham gia vào phân tích các sản phẩm dữ liệu hỏa hoạn toàn cầu nhằm thúc đẩy hiểu biết thêm về các chế độ hỏa hoạn và những mối liên kết phức tạp mà chúng thể hiện giữa sinh quyển và khí quyển. Chúng tôi cung cấp một cái nhìn tổng quan về các ràng buộc đối với các chế độ hỏa hoạn và vai trò của hỏa hoạn trong sinh quyển - khí quyển, mô tả các phương pháp chung đang được sử dụng để đánh giá hỏa hoạn - khí hậu toàn cầu, tóm tắt các cơ hội và cạm bẫy trong các bộ dữ liệu hỏa hoạn toàn cầu có công khai truy cập, và làm nổi bật tư duy về các bước tiếp theo cho phân tích dữ liệu hỏa hoạn toàn cầu và chế độ hỏa hoạn. Bản quyền © 2014 John Wiley & Sons, Ltd.
Bối cảnh biến đổi khí hậu đã đặt ra những vấn đề mới trong việc tính toán các mức độ quay lại (RL) của nhiệt độ bằng cách sử dụng lý thuyết giá trị cực đoan thống kê. Điều này xuất phát từ việc chưa thể chấp nhận giả thuyết rằng chuỗi các cực đại hoặc các giá trị cao là ổn định, mà không ít nhất xác minh giả định này. Do đó, trong bài báo này, các phương pháp khác nhau được thử nghiệm và so sánh để suy ra các mức độ quay lại bậc cao trong bối cảnh không ổn định. Các RL này được tính toán bằng cách ngoại suy các xu hướng đã được xác định, và một phương pháp bootstrap được sử dụng để ước lượng khoảng tin cậy. Việc xác định xu hướng có thể được thực hiện hoặc trong các tham số của các phân phối giá trị cực đoan hoặc trong trung bình và phương sai của toàn bộ chuỗi. Sau đó, một phương pháp luận được đề xuất để kiểm tra xem các xu hướng trong các giá trị cực đoan có thể được giải thích bởi các xu hướng trong trung bình và phương sai của toàn bộ tập dữ liệu hay không. Nếu đúng như vậy, các giá trị cực đoan trong tương lai có thể được suy ra từ các giá trị cực đoan ổn định của biến đã được trung bình hóa và chuẩn hóa cũng như những thay đổi trong trung bình và phương sai của toàn bộ tập dữ liệu. Các RL có thể sau đó được ước lượng là không ổn định hoặc ổn định cho các khoảng thời gian tương lai cố định. Công việc được thực hiện cho cả hai phương pháp giá trị cực đoan: cực đại khối và đỉnh vượt ngưỡng, và sẽ được minh họa bằng ví dụ về một chuỗi thời gian quan sát dài cho nhiệt độ tối đa hàng ngày ở Pháp. Bản quyền © 2010 John Wiley & Sons, Ltd.
Trong bài báo này, chúng tôi nghiên cứu ảnh hưởng của việc
Chúng tôi áp dụng phương pháp của mình cho một chuỗi dữ liệu sóng triều từ tây nam nước Anh, và minh họa sự khác biệt giữa phương pháp này và phương pháp POT, những khác biệt này nhất quán với việc phương pháp POT đánh giá thấp các mức trả lại trong thời gian dài. Chúng tôi cũng chú trọng đáng kể vào việc kiểm tra tính chắc chắn của kết quả, chứng minh rằng các vấn đề tính thiên lệch do phương pháp POT gây ra áp dụng một cách hệ thống trên tất cả các sơ đồ giảm cụm mà chúng tôi xem xét, cũng như trên toàn bộ phạm vi hành vi đuôi. Khi mối quan tâm chính là trong việc ước lượng mức trả lại, chúng tôi khuyến nghị quy trình của chúng tôi thường sẽ hiệu quả và đáng tin cậy hơn nhiều so với phương pháp POT. Nếu có sự quan tâm sâu hơn về bản thân sự phụ thuộc chuỗi, chúng tôi khuyến nghị rằng sự phụ thuộc này được
Các phương pháp hiện tại để điều chỉnh sai số phát hiện yêu cầu nhiều lần ghé thăm cùng một địa điểm khảo sát. Nhiều tập dữ liệu lịch sử tồn tại, được thu thập chỉ với một lần ghé thăm, và các yếu tố về logistics/chi phí ngăn cản nhiều chương trình nghiên cứu hiện tại thu thập dữ liệu từ nhiều lượt ghé thăm. Trong bài báo này, chúng tôi khám phá những gì có thể thực hiện với dữ liệu số lượng từ một lần ghé thăm khi có sai số phát hiện. Chúng tôi chứng minh rằng khi có các biến phù hợp ảnh hưởng đến cả phát hiện và độ phong phú, xác suất điều kiện có thể được sử dụng để ước lượng các tham số hồi quy của mô hình hỗn hợp Poisson nhị thức – gia tăng số không (ZIP) và điều chỉnh cho sai số phát hiện. Chúng tôi sử dụng số lượng quan sát của Chim Ovenbird (
Nhiều nghiên cứu gần đây đã báo cáo những ảnh hưởng đáng kể đến sức khỏe của ô nhiễm không khí ngay cả ở mức độ thấp của các chất ô nhiễm không khí. Những nghiên cứu này đã bị chỉ trích về phương pháp thống kê và sự không đồng nhất trong kết quả giữa các thành phố. Một diễn biến quan trọng trong dịch tễ học ô nhiễm không khí đã đến từ các nghiên cứu đa trung tâm. Trong dự án APHEA-2, chúng tôi đã phát triển một phương pháp thống kê để đánh giá các tác động sức khỏe ngắn hạn của ô nhiễm không khí bằng cách sử dụng dữ liệu từ 30 thành phố trên khắp Châu Âu. Đối với phân tích, một phương pháp mô hình phân cấp đã được áp dụng và triển khai trong hai giai đoạn: (a) dữ liệu từ mỗi thành phố được phân tích riêng biệt để cho phép sự khác biệt tại địa phương, sử dụng các mô hình hồi quy Poisson tổng quát; (b) các ước lượng tác động đặc thù của thành phố được hồi quy trên các biến đồng covariates đặc thù của thành phố để thu được một ước lượng tổng thể và khám phá sự không đồng nhất giữa các thành phố. Để minh họa phương pháp của chúng tôi, chúng tôi trình bày kết quả đối với các tác động của PM10. Người ta phát hiện rằng sự gia tăng 10 μg/m3 trong nồng độ PM10 hoặc NO2 liên quan đến việc tăng tổng tỷ lệ tử vong là 0.67% (95% CI: 0.50 đến 0.90) và 0.33% (0.20 đến 0.40), tương ứng. Sau khi điều chỉnh lẫn nhau, tác động của PM10 giảm 40% và tác động của NO2 giảm 20%, nhưng cả hai ước lượng kết hợp vẫn còn là đáng kể. Nồng độ NO2 trung bình dài hạn đóng vai trò là một yếu tố điều chỉnh cho các tác động của PM10, ngay cả sau khi đã điều chỉnh cho các tác động gây nhiễu của NO2. Trong giai đoạn thứ hai, chúng tôi đã khám phá hai mô hình khác nhau để kết hợp các tác động của PM10 đã được điều chỉnh cho NO2 giữa các thành phố: mô hình nhị biến, tính đến mối tương quan trong thành phố của PM10 và NO2; và mô hình đơn biến, không tính đến mối tương quan này. Cả hai mô hình đều cho ra kết quả tương tự nhau. Bản quyền © 2004 John Wiley & Sons, Ltd.
Một biến thể mới tên là ‘PMF’ trong phân tích yếu tố được mô tả. Giả định rằng
There are precious few statisticians involved in science policy, either nationally or internationally. In this paper I will, in an unusually personal way for a scientific journal, describe some of the possibilities for policy work and the potential impact such work can have. An example is the Intergovernmental Panel on Climate Change. I will also discuss ways that organizations, individuals, and the statistical community as a whole can get involved in policy aspects of research. And policy research is unavoidably political! Copyright © 2011 John Wiley & Sons, Ltd.
Numerous epidemiologic studies have reported associations between short‐term air pollution exposure and mortality. Such short‐term risk models include smooth functions of time to control for unmeasured confounding variables. We demonstrate bias in these short‐term Generalized Additive Model estimates because of lack of accounting for long timescale variations and propose a family of improved time smoothers to reduce and control the bias. The strengths of the proposed smoother are twofold: a clear separating of short‐term and long‐term effects and an obvious choice of smoothing parameters from pre‐determined timescales of interest. We demonstrate improvements through simulations and analysis of examples of air pollution and mortality data from Chicago, Il. from the National Morbidity, Mortality and Air Pollution Study database, showing reduced bias in the risk estimates. © 2015 The Authors.
Comparisons of trends across climatic data sets are complicated by the presence of serial correlation and possible step‐changes in the mean. We build on heteroskedasticity and autocorrelation robust methods, specifically the Vogelsang–Franses (VF) nonparametric testing approach, to allow for a step‐change in the mean (level shift) at a known or unknown date. The VF method provides a powerful multivariate trend estimator robust to unknown serial correlation up to but not including unit roots. We show that the critical values change when the level shift occurs at a known or unknown date. We derive an asymptotic approximation that can be used to simulate critical values, and we outline a simple bootstrap procedure that generates valid critical values and
- 1
- 2
- 3