新冠病毒還在世界范圍內傳播肆虐,對醫療資源提出巨大挑戰。許多醫院都建議醫生取消不必要的出診,以防止發生交叉感染的情況。這樣一來,大量的患者就涌入了遠程醫療應用程序和服務。
如何讓程序更懂新冠病毒,從而幫助病人進行有意義的醫療對話?
加州大學圣地亞哥分校、卡內基梅隆大學和加州大學戴維斯分校研究人員提出了利用人工智能聊天機器人來解決這個問題。目前他們的研究已經發表在預印本網站上。根據他們的研究,該聊天機器人可以對患者就有關新冠病毒的問題做出回應。
“在這項工作中,我們首次嘗試開發可以提供有關新冠病毒的醫學咨詢對話系統。實驗結果表明,這些經過訓練的模型有望就新冠病毒產生具有臨床意義的高質量咨詢。”研究人員在論文中稱。
據悉,整個團隊用英語和中文數據集訓練了支持這些聊天機器人的算法模型。數據集內容包含醫生與患者之間談論新冠病毒的對話,研究人員稱實驗證明這個模型對進行有益的醫學對話很有希望。
具體來說,研究人員在CovidDialog數據集訓練了集中對話模型,模型則來自在線醫療論壇。整個數據集包括603次英文數據,1088次中文數據。每次對話均以簡短描述患者的醫療狀況開始,然后是患者與醫生之間的對話,并且視情況提供醫生給出的診斷和治療建議。
論文合作者稱,他們基于谷歌的Transformer架構、OpenAI的GPT、BERT-GPT三方面來訓練模型。由于在相對較小的數據集上直接訓練模型會導致結果的泛化性,所以該團隊利用了轉移學習技術。即先在大型語料庫上對模型進行預訓練,然后再在CovidDialog數據集上進行微調。預訓練的語料庫則主要來自Reddit用戶、維基百科、中文聊天機器人、新聞、書籍、故事和其他網絡文本。
經過訓練后,對三種方法下訓練模型進行測試,來評估機器的表現。評估標準包括混亂程度,用來判斷機器人響應的質量和是否流暢;熵和距離,用來衡量詞匯的多樣性。最后結果顯示,利用BERT-GPT框架來懸鏈的模型,能對患者的問題進行回答,提供的答案更具相關性、信息量和人性化,并且語法和語義表達正確。
目前,研究人員已經將數據集和代碼在網上進行開源。