Khám Phá Kiến Thức Từ Hơn Một Thập Kỷ Nghiên Cứu Về Hệ Thống Dữ Liệu Lớn Trong Chăm Sóc Sức Khỏe: Một Nghiên Cứu Scientometrics

Journal of Big Data - Tập 6 - Trang 1-15 - 2019
Fatemeh Soleimani-Roozbahani1, Ali Rajabzadeh Ghatari2, Reza Radfar1
1Department of Information Technology Management, Science and Research Branch, Islamic Azad University Tehran, Tehran, Iran
2Department of Management, Tarbiat Modares University, Tehran, Iran

Tóm tắt

Hàng năm, nhiều bài báo nghiên cứu được công bố trên các tạp chí khoa học trên khắp thế giới. Kiến thức về tình trạng nghiên cứu là điều kiện tiên quyết cho việc lập kế hoạch và xây dựng chính sách nghiên cứu. Kiến thức này có thể được thu thập thông qua một nghiên cứu scientometrics về tài liệu đã công bố, phân tích các sản phẩm nghiên cứu trong một lĩnh vực khoa học. Chăm sóc sức khỏe luôn là một mối quan tâm thường trực của các nhà nghiên cứu và lĩnh vực phân tích Dữ liệu Lớn đang nhanh chóng mở rộng, đã bắt đầu đóng một vai trò quan trọng trong sự phát triển của các thực hành và nghiên cứu chăm sóc sức khỏe. Điều này đã thu hút sự chú ý từ giới học thuật, ngành công nghiệp và thậm chí cả chính phủ trên toàn thế giới đối với "Dữ liệu lớn trong Chăm sóc sức khỏe". Vì vậy, bài báo này đã thực hiện một phân tích tổng hợp về phương pháp nghiên cứu đã công bố trong lĩnh vực này trong giai đoạn 2008–2018. Kết quả thống kê cho thấy "Phân tích tổng hợp và bằng chứng" là phương pháp được sử dụng nhiều nhất trong các bài báo đã công bố. Chúng tôi đã áp dụng các kỹ thuật khai thác dữ liệu để dự đoán các phương pháp sử dụng trong các cơ sở dữ liệu khác nhau nhằm đạt được khám phá kiến thức trong lĩnh vực này. Bộ phân loại Naïve Bayes trong RapidMiner đã được áp dụng và kết quả cho thấy tám danh mục chính cho các từ được sử dụng trong các bài báo, trong khi "Phát triển các phương pháp để đánh giá chăm sóc" trung bình là phương pháp được dự kiến sử dụng nhiều nhất để công bố các bài báo và "Mô hình dựa trên tác nhân" là phương pháp được sử dụng nhiều nhất theo tính chất tự nhiên và có thể được dự đoán tốt hơn.

Từ khóa

#Dữ liệu lớn #Chăm sóc sức khỏe #Phân tích tổng hợp #Scientometrics #Khai thác dữ liệu

Tài liệu tham khảo

Roozbahani FS, Hojjati SN, Azad R. The role of E-payment tools and E-banking in customer satisfaction case study: Pasargad bank E-payment company. Int J Adv Netw Appl. 2015;7(2):2640–9. Poorebrahimi A, Roozbahani FS. Effects of security and privacy concerns on using of cloud services in energy industry, an oil and gas company: a case study. Int J Adv Netw Appl. 2015;7(3):2779–83. Skoric MM. The implications of big data for developing and transitional economies: extending the Triple Helix? Scientometrics. 2013;99(1):175–86. Roozbahani FS, Azad R. Security solutions against computer networks threats. Int J Adv Netw Appl. 2015;7(1):2576–81. Roozbahani FS, Barjouei RS, Hojjati SN. Identifying an appropriate model for information systems integration in the oil and gas industry. Int J Adv Netw Appl. 2018;10(1):3687–91. Poorebrahimi A, Razavi F, Roozbahani FS. Presenting VALIT frameworks and comparing between them and other enterprise architecture framework. Adv Netw Appl. 2016;7(4):2805–9. Nobre GC, Tavares E. Scientific literature analysis on big data and internet of things applications on circular economy: a bibliometric study. Scientometrics. 2017;111(1):463–92. How Big Data is transforming every business, in every industry. Bernard Marr & Co. https://www.bernardmarr.com/default.asp?contentID=767. Accessed 28 May 2018. Esselink J. Today Big Data and analytics is everywhere for everyone. IBM, 03.08.2017. https://www.ibm.com/blogs/think/nl-en/2017/03/08/today-big-data-analytics-everywhere-everyone/. Accessed 28 May 2018. Dull T. I see big data. All the time. It’s everywhere. SAS. https://www.sas.com/en_us/insights/articles/data-management/i-see-big-data.html. Accessed 28 May 2018. Adrianto B. The influence of Big Data implementation towards business models in different sectors (Master Thesis). Delft University of Technology. 2017. Li J, Ding W, Cheng HK, Chen P, Di D, Huang W. A comprehensive literature review on Big Data in healthcare. 2016. Raghupathi W, Raghupathi V. Big data analytics in healthcare: promise and potential. Health Inf Sci Syst. 2014;2(1):1–10. Fichman RG, Kohli R, Krishnan R. Editorial overview—the role of information systems in healthcare: current research and future trends. Inf Syst Res. 2011;22(3):419–28. Toga AW, Dinov ID. Sharing big biomedical data. J Big Data. 2015;2:7. Abouelmehdi K, Beni-Hessane A, Khaloufi H. Big healthcare data: preserving security and privacy. J Big Data. 2018;5(1):1–18. Herland M, Khoshgoftaar TM, Wald R. A review of data mining using big data in health informatics. J Big Data. 2014;1:2. van Altena AJ, Moerland PD, Zwinderman AH, Olabarriaga SD. Understanding big data themes from scientific biomedical literature through topic modeling. J Big Data. 2016;3:23. Adams J, Light R. Mapping interdisciplinary fields: efficiencies, gaps and redundancies in HIV/AIDS research. PLoS ONE. 2014;9(12):1–13. Alan P, Alex C, David Roessner J, Marty P. Measuring researcher interdisciplinarity. Scientometrics. 2007;72(1):117–47. Van Raan A. Scientometrics: state-of-the-art. Scientometrics. 1997;38(1):205–18. Big Data. Gartner, 2012. https://www.gartner.com/it-glossary/big-data/. Accessed 2018. Kwon O, Sim JM. Effects of data set features on the performances of classification algorithms. Expert Syst Appl. 2013;40(5):1847–57. McAfee A, Brynjolfsson E, Davenport TH, Patil DJ, Barton D. Big data: the management revolution. Harv Bus Rev. 2012;90(10):60–8. Russom P. The three vs of Big Data analytics. TDWI BLOG. 2011. White M. Digital workplaces: vision and reality. Bus Inf Rev. 2012;29(4):205–14. DeVan A. The 7V’s of Big Data. Impact, 7 Apr 2016. https://impact.com/marketing-intelligence/7-vs-big-data/. Accessed 10 Dec 2018. Pant P, Tanwar R. An overview of Big Data opportunity and challenges. In: Smart trends in information technology and computer communications. 2016. pp. 691–7. Jatrniko W, Arsa DMS, Wisesa H, Jati G, Ma’sum MA. A review of big data analytics in the biomedical field. In: Big Data and information security (IWBIS), international workshop on IEEE. 2016. pp. 31–41. Sahoo PK, Mohapatra SK, Wu SL. Analyzing healthcare Big Data with prediction. IEEE Access. 2016;4:9786–99. Wan K, Alagar V. Characteristics and classification of Big Data in health care sector. In: Natural computation, fuzzy systems and knowledge discovery (ICNC-FSKD), 2016 12th international conference on. IEEE. 2016. Ta VD, Liu CM, Nkabinde GW. Big Data stream computing in healthcare real-time analytics. In: Cloud computing and Big Data analysis (ICCCBDA), international conference on. IEEE. 2016. pp. 37–42. Viceconti M, Hunter PJ, Hose RD. Big data, big knowledge: big data for personalized healthcare. IEEE J Biomed Health Inform. 2015;19(4):1209–15. OECD Indicators. Health at a Glance 2011. Paris: OECD Publishing; 2011. Hermon R, Williams PAH. Big Data in healthcare: what is it used for?. In: Australian eHealth informatics and security conference. 2014. Al-Khoder A, Harmouch H. Evaluating four of the most popular open source and free data mining tools. Int J Acad Sci Res. 2015;3(1):13–23. Rangra K, Bansal KL. Comparative study of data mining tools. Int J Adv Res Comput Sci Softw Eng. 2014;6:4. Naive Bayes. rapidminer Documentation. https://docs.rapidminer.com/latest/studio/operators/modeling/predictive/bayesian/naive_bayes.html. Accessed 31 Jul 2018. Zhang H. The optimality of naive Bayes. AA. 2004;1(2):3. Friedman JH. On bias, variance, 0/1—loss, and the curse-of-dimensionality. Data Min Knowl Discov. 1997;1(1):55–77. Domingos P, Pazzani M. On the optimality of the simple Bayesian classifier under zero-one loss, Domingos, Pedro, and Michael Pazzani. Mach Learn. 1997;29(2–3):103–30. McCallum A, Nigam K. A comparison of event models for naive bayes text classification. In: AAAI-98 workshop on learning for text categorization, vol. 752, no. 1. 1998. Robertson SE, Sparck Jones K. Relevance weighting of search terms. J Am Soc Inf Sci. 1976;27(3):129–46. Lewis DD. An evaluation of phrasal and clustered representations on a text categorization task. In: Proceedings of the 15th annual international ACM SIGIR conference on research and development in information retrieval. ACM. 1992. Kalt T, Croft WB. A new probabilistic model of text classification and retrieval‏. Technical Report IR-78, University of Massachusetts Center for Intelligent Information Retrieval. 1996. Jacob. Text classification for sentiment analysis—precision and recall. Streamhacker, 17 May 2010. https://streamhacker.com/2010/05/17/text-classification-sentiment-analysis-precision-recall/. Accessed 31 Aug 2018.