Thứ năm, 31/10/2019 16:21 GMT+7

Phân tích, tổng hợp thông tin từ Web 2.0 và ứng dụng trong việc hỗ trợ cảnh báo dịch bệnh

Việc cảnh báo sớm các sự bùng phát có thể góp phần đưa ra các hành động quản lý và can thiệp nhanh. Đây chính là động cơ đằng sau tầm nhìn năm 2005 của hội nghị Sức khỏe Thế giới Thường niên (IHR). IHR-2005 cung cấp một khung pháp lý quốc tế cho việc phát hiện sớm, báo cáo và phản ứng đối với các dịch bệnh truyền nhiễm. Các quốc gia thành viên WHO phải có bổn phận về phát triển và duy trì các năng lực giám sát, báo cáo, thông báo, xác minh và phản ứng. Bất kỳ quốc gia nào có thông tin về dịch bệnh thì phải có bổn phận báo cáo với WHO trong vòng 24 giờ. IHR-2005 được đưa ra để đảm bảo nhận biết các sự bùng phát dịch bệnh kịp thời và có ý nghĩa đối với sức khỏe cộng đồng quốc tế và có biện pháp quản lý hiệu quả trước khi chúng lây lan.


Ví dụ của một từ đa ngôn ngữ tương ứng cho weakness và fatigue

 

Xét về lịch sử, nhiều sự bùng phát đã được báo cáo thông qua các mạng không chính thức của các chuyên gia chăm sóc sức khỏe. Những mạng này giúp phát hiện nhanh nhạy, kịp thời các bùng phát quan trọng và tiềm tàng. Chúng khác so với việc theo dõi sức khỏe cộng đồng truyền thống được đề cập trong IHR, thường dựa trên các nghiên cứu dịch tễ học cổ điển, các dữ liệu bệnh sử hay trong phòng thí nghiệm, và tính ứng dụng của chúng thường đi sau các sự kiện mà chúng mô tả hàng ngày hoặc hàng tháng. Phương pháp tiếp cận này có thể kém chính xác hơn so với việc theo dõi sức khỏe cộng đồng truyền thống, dù vậy nếu đem so sánh nó có thể phù hợp với việc thiết kế một mạng cung cấp cảnh báo sớm.

Các dịch vụ cung cấp tin tức RSS là một trong những nhân tố đầu tiên hình thành nên Web 2.0 với hai ưu điểm chính: 1) khả năng tổng hợp/tích hợp và cung cấp thông tin, và 2) tốc độ cập nhật nhanh. Hai yếu tố này đáp ứng về cơ bản điều kiện cần cho một hệ thống cảnh báo, dự báo. Tuy nhiên điều kiện đủ là cần phải phát triển các công cụ mạnh để phân tích các thông tin RSS này. Trong phạm vi nhiệm vụ, chúng tôi đề xuất nghiên cứu việc phân tích xử lý thông tin từ các dịch vụ cung cấp tin tức RSS tiếng Việt để xây dựng một hệ thống hỗ trợ phát hiện theo dõi dịch bệnh bảo vệ sức khỏe cộng đồng.

Việc kế thừa và phát triển những kết quả nghiên cứu trong và ngoài nước về Web 2.0, xử lý tiếng Việt, việc hợp tác với những nhóm nghiên cứu trong các lĩnh vực này là một yếu tố quan trọng để đảm bảo cho sự thành công của đề tài. Để đạt được mục tiêu, Cơ quan chủ trì Học viện Công nghệ Bưu chính Viễn thông phối hợp với Chủ nhiệm đề tài ThS Nguyễn Thị Ngọc Vinh cùng thực hiện đề tài.

Sau thời gian nghiên cứu, Đề tài đã hoàn thành về số lượng và chất lượng các sản phẩm đăng ký trong hợp đồng KHCN và thuyết minh đề tài. Cụ thể, nhóm đề tài đã xây dựng thành công phần mềm có khả năng giám sát và tổng hợp tin về dịch bệnh từ nguồn RSS trên các báo điện tử với các chỉ tiêu chất lượng như sau: i) độ chính xác phân loại tin trên 85%; ii) độ chính xác tách tên bệnh và địa danh (F-measure) trên 80%; iii) tốc độ xử lý 100 tin RSS dưới 5 giây; iv) có khả năng xử lý tốt bản tin tiếng Việt.

Sản phẩm phần mềm do nhóm đề tài xây dựng có chất lượng tương đương sản phẩm cùng loại trên thế giới (chẳng hạn hệ thống Biocaster của Nhật), đồng thời có khả năng xử lý trực tiếp tiếng Việt, thay vì phải thông qua công cụ dịch tự động như Google translate, do vậy cho kết quả xử lý tin tiếng Việt kịp thời và chính xác hơn.

Phần mềm sản phẩm đề tài có thể phục vụ việc theo dõi thông tin về dịch bệnh phục vụ công tác theo dõi, cảnh báo sớm trong lĩnh vực vệ sinh dịch tễ và y tế cộng đồng.

Các phương pháp phân tích, xử lý dữ liệu văn bản phát triển trong phạm vi đề tài cũng như cách thức xây dựng phần mềm có thể mở rộng cho các dạng thông tin khác ngoài RSS, cũng như phục vụ theo dõi, giám sát thông tin trong nhiều lĩnh vực ngoài y tế và thú y.

Các hướng nghiên cứu trong phạm vi đề tài đều có khả năng tiếp tục phát triển nếu được đầu tư nghiên cứu trong tương lai.


Có thể tìm đọc báo cáo kết quả nghiên cứu (mã số 139993/2017) tại Cục Thông tin KH&CN quốc gia.

Nguồn: Cục Thông tin KH&CN quốc gia

Lượt xem: 1723

Tìm theo ngày :

Đánh giá

(Di chuột vào ngôi sao để chọn điểm)