CSDL NVSS: tác giả Việt nam có bài công bố khoa học Scopus, ISI, Nafosted

Ứng dụng Google và mạng xã hội trong việc dự đoán dịch bệnh

SSHPA (09-04-2020) — Theo một nghiên cứu được đăng tải ngày 16 tháng 3 năm 2020 trên tạp chí Scientific Reports (2018 IF = 4.122, H Index = 149) của Nature Research với tiêu đề “Comparing Social media and Google to detect and predict severe epidemics” (tạm dịch: So sánh mạng xã hội và Google trong phát hiện và dự đoán dịch bệnh nguy hiểm), nhóm tác giả Loukas Samaras, Elena García-Barriocanal & Miguel-Angel Sicilia (University of Alcalá, Tây Ban Nha) đã so sánh sự chính xác của Google và một mạng xã hội phổ biến, Twitter, trong việc dự đoán sự bùng phát của dịch cúm tại Hi Lạp trong khoảng thời gian 23 tuần (từ 13/12/2018 đến 20/5/2019).

Trong nghiên cứu kéo dài 9 tháng này (từ 01/8/2018 đến 30/6/2019), nhóm tác giả đã thu thập những dữ liệu với từ khóa “dịch cúm” trong tiếng Hy Lạp từ Google Trends và Twitter, sau đó đối chiếu với những thông tin đã được kiểm chứng của European Center of Disease Control and Prevention (ECDC). Trong khoảng thời gian 23 tuần kể trên, những dữ liệu từ ECDC và Google được thống kê hằng tuần, trong khi dữ liệu từ Twitter (khoảng hơn 18000 tweet) được thống kê hằng ngày, hằng tuần và theo cả thời gian thực để tiện cho việc so sánh kết quả.

Sau khi phân tích dữ liệu hằng tuần bằng biểu đồ ARIMA (Auto Regression Integrated Moving Average) và dữ liệu hằng ngày bằng một biểu đồ tương đương mà nhóm tự thiết kế (customized approximate model), nhóm tác giả đã tìm ra những kết quả khá thú vị. Trong cuộc “đối đầu” về tính chính xác này, Twitter đã có phần nhỉnh hơn Google. Cả hai đều dự đoán đúng thời điểm đỉnh dịch xảy ra vào nửa đầu tháng 2 năm 2019, đều dự đoán gần chính xác số lượng ca nhiễm (Twitter: 11558.94 ca; Google: 11522.46 ca; thực tế: 11368.68 ca) và số lượng ca nhiễm vào đỉnh dịch (Twitter: 1298.12; Google: 1248.68; thực tế: 1241.75 ca).

Tuy nhiên, thông số quan trọng giúp nhóm tác giả đưa ra kết luận rằng Twitter chính xác hơn Google chính là độ lệch phần trăm tuyệt đối trung bình (Mean Absolute Percentage Error). Theo đó, thông số này của Google là 21.358, trong khi của Twitter thấp hơn, đồng nghĩa với tính chính xác cao hơn, chỉ là 18.742.

Đánh giá về kết quả trên, nhóm tác giả cho rằng Twitter chính xác hơn Google trong việc dự báo dịch bệnh là do thông tin trên mạng xã hội này có thể được theo dõi và thu thập trong một khoảng thời gian ngắn hơn và thường xuyên hơn so với Google hay các hệ thống theo dõi chính thức. Các hệ thống này cập nhật thông tin theo tuần, trong khi qua Twitter, những thông tin về dịch bệnh được cập nhật và dự đoán hằng ngày, thậm chí liên tục hằng giờ.

Dù kết quả của nghiên cứu còn một vài hạn chế (giới hạn về mặt địa lý và ngôn ngữ ở trong phạm vi Hy Lạp, không thể xác thực được nguồn gốc của tất cả các thông tin), song đây có thể là tiền đề để các nhà khoa học bắt đầu áp dụng các dữ liệu trên internet trong việc dự đoán và ngăn chặn kịp thời các dịch bệnh nguy hiểm đối với loài người trong tương lai.

* Thông tin thư viện (APA):

Samaras, L., García-Barriocanal, E. & Sicilia, M. (2020). Comparing Social media and Google to detect and predict severe epidemics. Sci Rep 10, 4747. https://doi.org/10.1038/s41598-020-61686-9

** Trần Đức Hưng Long, Ritsumeikan Asia Pacific University, Nhật Bản (Email: [email protected])


Bài liên quan:


Ý kiến bạn đọc (0):