作為新一輪科技革命和產業變革的重要驅動力——人工智能,已連續三年被寫進政府工作報告中,“關鍵核心技術”更是近年來首次出現在政府工作報告中,而自然語言理解技術就是支撐人工智能得到廣泛應用的關鍵核心技術。
過去十年自然語言理解技術已有了重大突破,在語音識別和機器翻譯等領域都取得了長足發展,但在實際應用中還存在很多不足,譬如大部分“智能客服”還基本處于“智障客服”階段。因此需要繼續加強對自然語言理解技術的投入,從而讓人工智能從感知智能跳躍到認知智能。
認知智能市場大有可為 NLP開放平臺應運而生
從技術到產品,從產業端到市場化,NLP落地應用的探索長期以來面臨著幾座大山。一是NLP技術的“知名度”不足,許多人不知道該技術怎么用以及如何獲取;二是學術研究與產業脫節的問題,掌握NLP最前沿技術的人幾乎都在高校中,而最需要使用這項技術的人還在市場中苦苦尋覓;三是針對各個行業的語料庫數據不足,導致落地時無法順利推進。
在當前NLP產學研用仍處于被動掣肘的大環境下,中國人工智能市場的發展規模又是怎樣一番景象呢?我們來看一組數據:
聚焦NLP市場:放眼全球,whatech預測2020年全球NLP市場規模將近134億美元,而隨著中國NLP市場的逐年擴大,保守估計到2020年,中國NLP市場至少占全球900億人民幣的10%,約90億人民幣,并將帶動1000億相關市場的發展。此時,正處于少年期的NLP將一展身手,大有可為。
NLP被稱為人工智能“皇冠上的明珠”,也是人工智能領域最難突破的部分。中國聲谷運營單位總裁祁東風表示,“作為全國首個定位于人工智能領域的國家級產業基地——中國聲谷通過自然語言理解技術的市場應用倒逼基礎理論和關鍵技術創新,走出了一條獨特且可持續的發展路徑,與神州泰岳、國家中文信息學會聯合打造了國內首個‘NLP開放平臺——中文信息(深度)處理開放創新平臺’,將NLP核心技術應用向各行業各領域縱深推進。”
NLP開放平臺精耕細作 將實現多場景應用落地
針對NLP的中文歧義性難題,NLP開放平臺擁有獨創的“本體建模技術”,把與場景相關的領域知識、NLP任務、語言資源等內容進行形式化規范描述,使得NLP場景應用實現最大化的共享;如何處理語言結構的另一難題,平臺又將符號化語義與深度學習技術結合,即能有效地識別多種語言結構,實現同一意思、不同結構的歸一化處理。據了解,擁有自主知識產權的智慧語義認知技術對語言結構的遞歸嵌套處理也表現優異,目前該平臺已經具備可以識別出3層以上語言結構遞歸嵌套的技術,極大增強了NLP的可解釋性。
“NLP縱深行業應用,需要盯準需求,貼合業務,直擊行業痛點,才能打開市場,獨占鰲頭。”近日,中國聲谷入園企業—神州泰岳副總裁李國東在以“見智見未來”為主題的2019全球人工智能產品應用博覽會上介紹,神州泰岳在人工智能語義技術擁有10余年的技術研發優勢,更是中國中文信息學會唯一指定的產學研合作單位,2018年依托中國聲谷的“政策紅利”和自身在NLP技術上的前沿科技對NLP開放平臺進行全面的資源整合、精耕細作,已在多領域推動NLP技術賦能行業應用。
公安行業首當其沖,去年神州泰岳推出了一款面向公安行業的綜合應用產品——“智腦2.0”,以人工智能-自然語言處理(AI-NLP)為核心,以極速計算、實體360°全息畫像、數據共享為支撐的跨警種跨網域的產品,適用于公安全警種。最重要的是,“智腦2.0”獨有的公安筆錄文本分析功能,能通過感知智能技術和語義智能識別,對所有警員的有效研判動作進行記憶存儲及分析,把海量的公安筆錄全部閱讀記錄,并且進行提煉、歸納,將零碎的信息關聯起來,為將來一鍵破案做足夠積累。
公安只是NLP技術落地的其中一個場景,只要有語言、有文本的地方,都能用上NLP技術。增值境外服務——智慧旅游小漫、知識產權及專利審查及服務、法務及合同審查服務、智慧招聘、中醫古籍知識挖掘服務、新聞(簡訊)寫作、會議通知、調研報告自動寫作等等。NLP平臺已開放的服務涵蓋16個行業領域、140多個場景和200多個服務,未來將真正實現讓NLP技術賦能應用開發。
神州泰岳中國聲谷
神州泰岳是中國聲谷引入的智能語義領域龍頭企業,于2017年正式入園。神州泰岳在人工智能語義技術擁有10余年的技術研發優勢,更是中國中文信息學會唯一指定的產學研合作單位。2018年,中國聲谷攜手神州泰岳在推進發展智能語義應用與生態系統建設新聞發布會上,正式發布NLP開放創新平臺。早前,權威媒體《互聯網周刊》聯合eNet研究院發布了“2018年度人工智能企業TOP100”,榜單中收錄了中國互聯網、人工智能、生物識別、大數據、基因健康等多領域的知名企業,神州泰岳作為NLP引領者榮列人工智能企業百強榜單,并位列TOP18.