近日,AAAI 2020大會放榜,在今年提交的8800篇論文中,最終錄取數量為1591篇,接收率20.6%。小i機器人研究院團隊聯合加州大學戴維斯分校發表的論文《MOSS: End-to-End Dialog System Framework with Modular Supervision》入選AAAI 2020大會,標志著小i機器人的人工智能相關技術得到了更多國際頂尖學術會議的認可。
關于AAAI 2020
AAAI的全稱是 Association for the Advance of Artificial Intelligence——美國人工智能協會。該協會是人工智能領域的主要學術組織之一,其主辦的年會也是人工智能領域的國際頂級會議。在中國計算機學會的國際學術會議排名以及清華大學新發布的計算機科學推薦學術會議和期刊列表中,AAAI均被列為人工智能領域的A類頂級會議。據悉,第34屆AAAI大會——AAAI 2020將于2020年2月7日-2月12日在美國紐約舉辦。
關于入選論文
《MOSS:End-to-End Dialog System Framework with Modular Supervision》是小i機器人研究院團隊與加州大學戴維斯分校聯合發表的一篇關于面向任務型對話的論文。MOSS(模塊化監督網絡)是一個End-to-End的Encoder-Decoder訓練框架,整合了來自中間對話系統中的各種有監督模塊,包括自然語言理解、對話狀態跟蹤、對話策略學習和自然語言生成。由于缺乏數據是訓練端到端面向任務的對話系統的主要瓶頸,MOSS更有效地利用有限的培訓數據,在只有60%的訓練數據條件下,讓CamRest676任務達到了最先進的水平。在只有40%的訓練數據條件下,讓復雜的筆記本電腦網絡故障排除數據集(LaptopNetwork)任務達到了最先進的水平。此外,MOSS也是一個靈活的框架,可以去掉一些模塊的監督學習,是一個可插拔使用的模型。
論文提出了遵循模塊化系統的思路,在一個端到端的可訓練框架中,為每個對話模塊注入豐富的監督。在MOSS框架下,諸如自然語言理解、對話狀態跟蹤、對話策略學習和自然語言生成等對話模塊共享一個編碼器,但分別有各自的解碼器。不同模塊的解碼器通過隱藏狀態連接,而不是通過符號輸出。然后對各模塊進行聯合優化,避免誤差傳播和模型失配。此外,由于MOSS在測試過程中會產生單個模塊的輸出,所以可以通過檢查模塊輸出來輕松定位錯誤。
值得一提的是,該入選論文中還首次發表了LaptopNetwork——由小i機器人研究院團隊與加州大學戴維斯分校共同收集整理的一個真實的筆記本電腦網絡故障排除的中文任務。LaptopNetwork數據集收集來自于一個在線打字的售后服務平臺,它涉及到有技術問題的真實客戶和專業的電腦維護工程師,因此更加真實。在LaptopNetwork中,工程師可能會根據客戶的反饋給出不同的解決方案。LaptopNetwork有來自97名工程師的618個對話,每個對話平均14.76個回合,每個話語平均有51.67個漢字,每個對話平均耗時985.82秒。為LaptopNetwork開發一個注釋方案是很有挑戰性的,因為對話框中充滿了諸如“網絡適配器”和“網絡編程接口”之類的計算機維護術語,這些術語對于初學者來說很難理解。論文最后確定了60種不同的對話行為,其中12種是與網絡解決方案相關的對話行為。與CamRest676這類只有請求和提供信息兩種對話行為的信息查詢任務相比,論文提出的網絡故障排除任務要復雜得多。
通過論文的實驗結果表明,當對話任務具有更復雜的對話狀態和操作空間時,引入模塊化監控會帶來更大的好處。如圖所示,在只有40%的訓練數據的情況下,MOSS-all在所有指標上都優于TSCP。

小i機器人用認知智能技術探索無限可能
多年來,小i機器人非常注重產學研的深度結合,研發探求技術創新,也一直將最新的認知智能技術研究成果和落地應用展示于國際頂級學術會議和賽事中。今年7月,小i機器人研究院團隊在國際權威機器閱讀理解評測SQu AD1.1挑戰賽中獨立參賽斬獲全球第三的成績;9月,小i機器人聯合北京郵電大學發表的論文在中國智能自動化大會(CIAC)上獲得“最佳論文獎”;10月,小i機器人憑借優秀的技術創新能力和成熟的商業應用能力獲得“第九屆吳文俊人工智能科技進步獎”等。
未來,小i機器人也會將先進的認知智能技術與產業應用相融合,賦能產業發展,用認知智能技術探索人工智能的無限可能。