Phát hiện COVID-19 qua tiếng ho bằng giải pháp AI
Nắm bắt những thay đổi siêu nhỏ
Những người nhiễm COVID-19 ở giai đoạn đầu hoặc nhiễm không triệu chứng thường ít khi nghĩ tới việc xét nghiệm, do đó có thể vô tình lây nhiễm cho người khác. Nhưng thực ra ít người biết rằng, một khi khi virus xâm nhập vào cơ thể, bản thân chúng đã bắt đầu tạo nên những thương tổn ở hệ hô hấp khiến âm thanh phát ra không còn giống như lúc khỏe mạnh. Tai người có thể không nhận ra những khác biệt siêu nhỏ khi không khí tương tác với hàng trăm cơ bắp bị suy yếu và những thay đổi bề mặt do viêm phù, nhưng hóa ra trí tuệ nhân tạo lại có thể.
Khi dịch bệnh bắt đầu lan ra ở Việt Nam từ giữa năm ngoái, một nhóm các nhà nghiên cứu, kỹ sư học máy và chuyên gia dịch tễ do anh Lê Công Thành (InfoRe) và TS. Phạm Minh Tuấn (TFI Group) khởi động đã bắt tay vào một dự án cộng đồng mang tên AICOVIDVN nhằm xây dựng các mô hình AI có khả năng phân biệt tiếng ho của người Việt mắc COVID-19 với những người khỏe mạnh khác.
Họ đào tạo các kiến trúc mạng thần kinh khác nhau dựa trên việc phân tích phổ tần (spectrum) của hàng chục ngàn mẫu tiếng ho chủ động. Nhờ hiểu biết về các rối loạn hô hấp đặc trưng do COVID-19 và những chỉ dấu sinh học có khả năng ảnh hưởng đến tiếng ho mà những nghiên cứu AI trước đó đã chỉ ra, nhóm dự án kỳ vọng rằng những thuật toán có thể tự phân loại và học được những đặc điểm “khuôn mẫu” về tiếng ho của người mắc COVID-19.
TS. BS. Phạm Quang Thái (Viện Vệ sinh Dịch tễ Trung ương), cố vấn y tế của dự án, so sánh điều này với xét nghiệm PCR: Nếu các đoạn gene của mẫu xét nghiệm trùng với các đoạn gene của SARS-CoV-2, chúng ta kết luận người đó mắc COVID-19 chứ không phải cúm hay virus khác. Tương tự, nếu AI phát hiện ra tiếng ho của một người có những đặc điểm khớp với các khuôn mẫu đặc trưng về tiếng ho của bệnh nhân F0 thì có thể chẩn đoán người đó đang dương tính với COVID-19.
Mô hình cho người Việt
Thực ra, việc phân tích tiếng ho để phát hiện các bất thường của hệ hô hấp đã được các nhà khoa học trên thế giới nghiên cứu từ ít nhất ba năm trước đại dịch. Các hệ thống dựa trên AI đã chứng minh được hiệu quả trong việc phát hiện bệnh lao (TB) và bệnh Alzheimer (căn bệnh có thể làm suy giảm trí nhớ và suy thoái các cơ thần kinh của dây thanh).
Dựa trên những tiền đề này, khi dịch bệnh bùng phát vào năm 2020, nhiều nhóm nghiên cứu trên toàn thế giới đã tập trung phát triển những mô hình xử lý tiếng ho COVID để sàng lọc trên diện rộng, nổi bật là các dự án của Đại học MIT (Mỹ), Đại học Cambridge (UK), Viện Công nghệ Liên bang Thụy Sĩ Lausanne (EPFL) và Viện Trí tuệ nhân tạo Wadhwani ở Mumbai (Ấn Độ). Tuy nhiên, độ chính xác của các dự án này dao động khá lớn, từ 60%-96%.
Đồng thời, vì đặc điểm tiếng ho của người dân ở các quốc gia cũng có sự khác biệt nên các mô hình AI trên thế giới chưa chắc đã đúng với người Việt. Để có thể tạo ra những mô hình tốt nhất cho Việt Nam, nhóm dự án quyết định huy động sức lực của cộng đồng.
“Chúng tôi mở ra cuộc thi Hackathon AICOVIDVN 115M Challenge trên AIHUB và cung cấp dữ liệu tiếng ho - lần đầu là tiếng ho của người nước ngoài, lần hai là tiếng ho của người Việt - để các kỹ sư AI trên khắp Việt Nam có thể tham gia phát triển những mô hình khác nhau. Khi cuộc thi kết thúc, nhóm dự án chọn ra những mô hình có hiệu suất cao nhất để tiếng tục nghiên cứu, cải tiến” TS. Vũ Xuân Sơn (Đại học Umeå), điều phối công nghệ của dự án, cho biết.
Ban đầu, khi chưa có bất kỳ mẫu tiếng ho người Việt nào, những thành viên cốt cán đã phải gõ cửa từng dự án nước ngoài để xin dữ liệu đào tạo nên mô hình. Họ quan niệm rằng phải tìm cách tạo ra “khung nhà” trước khi có đủ dữ liệu tiếng ho người Việt, vì nếu chờ đến khi đủ rồi mớt bắt tay làm thì sẽ không kịp chạy theo tình hình dịch bệnh. Một số bên đã từ chối chia sẻ nhưng cũng có những bên sẵn lòng cung cấp.
Trong nhiều ngày, hàng chục cộng tác viên từ công ty dán nhãn dữ liệu Dataset đã được huy động để định dạng lại dữ liệu, làm sạch và dán nhãn hơn 7.000 mẫu tiếng ho từ Thụy Sĩ, Ấn Độ và nhiều quốc gia khác. Dựa trên dữ liệu lần đầu này, hơn 200 kỹ sư đã tham gia vào Thử thách cộng đồng để tạo ra nhiều mô hình khác nhau, trong đó giải pháp dẫn đầu đạt độ chính xác (AUC) tới 91%, chỉ kém 6% so với kết quả tốt nhất mà nhóm nghiên cứu của Đại học MIT tạo ra.
Một poster của dự án vào giữa năm 2021 giới thiệu cách AI phân biệt tiếng ho | Ảnh: FB/aicovid
Tuy nhiên, giai đoạn thứ hai để phát triển giải pháp AI trên dữ liệu tiếng ho của người Việt lại không dễ dàng như vậy. Lúc đó, cả Việt Nam đang gồng mình để chữa trị cho bệnh nhân COVID-19, đa phần mọi người mang tâm lý lo ngại F0 nên ngay cả việc ho vào điện thoại cũng khó khăn. TS. Phạm Minh Tuấn, quản lý truyền thông của dự án, đã phải nhờ các bác sĩ ở vùng dịch trực tiếp cầm điện thoại cho bệnh nhân ho, đồng thời tổ chức các chiến dịch marketing để báo chí, truyền thông giúp sức kêu gọi người dân đóng góp tiếng ho. Cùng với bộ dữ liệu âm thanh từ dự án Sound Dr. của FPT.AI, nhóm đã lấy được tầm 500 mẫu tiếng ho F0 và mở ra Thử thách cộng đồng lần thứ hai để xây dựng những mô hình mới trên tập dữ liệu người Việt. Các mô hình lần này có độ chính xác AUC đạt từ 91% đến 93% trên tập dữ liệu kiểm thử riêng biệt.
“Nếu như không có sự thay đổi về bệnh lý thì khả năng cao là tập dữ liệu của chúng ta cơ bản đã đủ cho thử nghiệm giải pháp”, TS. Vũ Xuân Sơn cho biết. “Tuy nhiên, vì dịch COVID vẫn đang thay đổi từng ngày, dẫn đến tình trạng các mô hình AI có thể rất chính xác trong tập dữ liệu đào tạo ban đầu nhưng lại nhanh chóng suy giảm khi áp vào dữ liệu thực tế. Đây là một điều rất phổ biến trong học máy”.
Dữ liệu mà dự án thu thập được vào giữa năm ngoái chủ yếu thuộc về biến chủng Delta. Nhưng do đặc tính sinh học, các biến chủng COVID-19 có thể gây nên những tiếng ho khác nhau. “Chủng Delta thường tấn công ở vùng sâu của phổi tạo ra các hốc, khiến tiếng ho có âm dội đặc trưng. Chủng Omicron phổ biến hiện nay lại gây ảnh hưởng nhiều đến hệ hô hấp trên, làm dây thanh nề lên, cổ họng khô rát, cùng với đó là phù nề xoang mũi, khiến tiếng ho phát ra giống kiểu ho khan kèm nghẹn”, TS. BS. Phạm Quang Thái giải thích.
Chính bởi độ lệch của phân phối dữ liệu như vậy nên độ chính xác của những mô hình thu được trong giai đoạn hai đã giảm chỉ còn 64% khi thử trên dữ liệu thực tế. Bản thân các kỹ thuật viên cũng không khỏi hoang mang khi một số mô hình “giây trước đoán là dương tính, giây sau đã cho kết quả âm tính”.
Như mọi bài toán dùng AI, nếu dữ liệu tiếng ho của người nhiễm COVID ở các chủng khác nhau càng dày thì khả năng học tập và phân tích của AI càng chính xác. Để “tiếp tế” dữ liệu cho AI học và thử nghiệm các mô hình này đối với người dùng, dự án AICOVIDVN đã bắt tay với các công ty khởi nghiệp về công nghệ y tế như Med247, iSofHcare, BookingCare và tổng đài Robotcall ở TP.HCM để tích hợp AI chẩn đoán tiếng ho vào các ứng dụng của họ. Người dùng có thể gửi tiếng ho, phần mềm sẽ xem xét nguy cơ dương tính và đề xuất có nên tiếp tục xét nghiệm y tế (PCR) hay không.
“Nhờ đó, chúng tôi có thêm một kênh thu thập dữ liệu tiếng ho của bệnh nhân tốt hơn và đều đặn hơn. Nếu một người thường xuyên đóng góp tiếng ho, cả lúc bình thường và khi ốm đau, thì thuật toán sẽ rất dễ dàng tìm ra những thay đổi trong tiếng ho và có thể chẩn đoán cực kì chính xác khả năng nhiễm COVID”. TS. Vũ Xuân Sơn nói. Bên cạnh đó, dự án vẫn luôn duy trì một website tại địa chỉ https://tiengho.aicovidvn.org/ để bất kì ai cũng có thể tải các file ghi âm tiếng ho của mình lên.
Nhưng dù đã nỗ lực rất nhiều thì dữ liệu tiếng ho F0 của họ vẫn đang ở mức khiêm tốn. Có thời điểm mỗi ngày Việt Nam ghi nhận hàng chục nghìn ca COVID nhưng dữ liệu mà dự án thu về cũng chỉ lác đác. “Khi bị ốm, mọi người thường sẽ đi tìm bác sĩ chứ không để ý đến việc ho vào điện thoại. Dữ liệu vẫn là bài toán mà chúng tôi đang loay hoay” TS. Vũ Xuân Sơn nói.
Một mặt, các thành viên của AICOVIDVN vẫn nỗ lực vận động cộng đồng đóng góp thêm dữ liệu; mặt khác, đội ngũ kỹ sư của nhóm vẫn đang tìm cách để những mô hình này có thể phát hiện ra những biến chủng mới từ rất ít dữ liệu thêm vào mà không cần đợi đến khi có 1.000 hay 10.000 ca nhiễm. Họ đã đưa 5 mô hình tốt nhất mà cộng đồng tạo ra qua hai thử thách đến 3 nhóm nghiên cứu chuyên môn tại các phòng thí nghiệm học máy hàng đầu thế giới để tiếp tục tinh chỉnh.
Không dừng lại ở COVID
Cuộc khủng hoảng COVID đã đặt ra bài toán phát triển những biện pháp sàng lọc bằng công nghệ nhằm phát hiện các ca dương tính và cắt đứt chuỗi lây truyền của virus. Ứng dụng AI phát hiện tiếng ho COVID là một ví dụ điển hình như vậy.
Các nhà phát triển dự án AICOVIDVN nói rằng trong trường hợp tốt nhất, khi giải pháp đã ổn định và vượt qua được những yêu cầu thẩm định của ngành y tế thì các kỹ sư sẽ đóng gói công nghệ và chuyển giao lại cho các cơ quan chức năng hoặc doanh nghiệp có nhu cầu phát triển app y tế để sử dụng lâu dài.
Giao diện của một Medtech tích hợp chức năng thu thập tiếng ho | Ảnh chụp màn hình
Nhưng với tình hình dịch bệnh có xu hướng “bình thường hóa” như hiện nay thì liệu kết quả này còn có ý nghĩa? TS. BS. Phạm Quang Thái cảnh báo rằng đây là một suy nghĩ “rất nguy hiểm” và cũng chính là vấn đề mà vaccine đang đối mặt. Nhiều người chủ quan vì thấy tình hình dịch bệnh đã được kiểm soát, nhưng điều gì sẽ xảy ra nếu một đợt dịch khác bùng phát hoặc xuất hiện một chủng virus nguy hiểm mới? Điều gì sẽ xảy ra nếu Việt Nam không có sự chuẩn bị để phản ứng đủ nhanh với một loại dịch mới?
“Virus biến đổi không ngừng và các tác nhân gây bệnh nguy hiểm trong tương lai cũng không ngừng xuất hiện. Hiện giờ là vấn đề COVID nhưng sau này có thể là cúm gia cầm hay bất kỳ bệnh truyền nhiễm nào khác mà ta không bao giờ biết được cho đến khi chúng xảy ra. Chính vì thế, chúng ta không được phép bị động”, TS.BS. Phạm Quang Thái khẳng định.
TS. Vũ Xuân Sơn nói rằng việc phát triển AI nhận biết tiếng ho cho bệnh COVID thực chất không chỉ dừng lại ở mỗi căn bệnh, mà còn có thể mở rộng ra cho nhiều bệnh liên quan đến đường hô hấp khác. Trong lúc phát hiện tiếng ho COVID-19, dự án đã thu thập được một phần nhỏ dữ liệu có dán nhãn bệnh nền về tình trạng hút thuốc lá, viêm phổi, hen suyễn, COPD, tim mạch, tiểu đường…, cung cấp hiểu biết ban đầu cho việc ghi nhận đặc điểm của các bệnh ngoài COVID.
Hiện tại, cùng với TS. Harry Nguyễn (ĐH Glasgow) và TS. Nguyễn Duy Khương (FPT.AI), TS. Vũ Xuân Sơn vẫn tiếp tục nghiên cứu và xin các khoản tài trợ nghiên cứu để giải quyết các bài toán chuyên sâu về phân tích tiếng ho COVID và mở rộng ra cho các bệnh lý biểu hiện qua giọng nói (voice pathology).
Do tiềm năng to lớn của AI trong việc sàng lọc trên diện rộng, TS. Vũ Xuân Sơn vẫn luôn mơ ước về một hệ thống theo dõi bệnh tật có thể áp dụng cho một quần thể dân cư hoặc cả nước. “Khi có một hệ thống tin cậy, chỉ cần mỗi ngày có vài phần trăm dân số thường xuyên cung cấp tiếng ho hoặc giọng nói thì chúng ta đã có thể cảnh báo nguy cơ về dịch bệnh sắp tới trong cộng đồng”, anh nói.
AICOVIDVN là một dự án công nghệ cộng đồng, được khởi xướng và điều phối bởi anh Lê Công Thành (InfoRE), TS. Phạm Minh Tuấn (TFI), TS. Vũ Xuân Sơn (ĐH Umeå), TS. Harry Nguyễn (ĐH Glasgow), anh Lê Thanh Hưng, TS. Nguyễn Hữu Tiệp (Google), cùng với sự đồng hành và hỗ trợ từ các co-founders của các startup công nghệ nổi tiếng trong nước.
Dự án đã nhận được tài trợ về cơ sở tính toán đến của Amazon AWS Vietnam, CMC Cloud, iRender, cũng như sự đồng hành của các công ty công nghệ như Med247, DopikAI, iSofHcare, BookingCare, tổng đài Robotcall, Dataset.vn, FPT.AI, LEADS.VN, SotaTek, AIHUB.VN, và hàng trăm kỹ sư công nghệ, tình nguyện viên trên khắp đất nước.
https://khoahocphattrien.vn/