人工智能技術主要通過兩方面進行產業賦能:一方面它能夠創造虛擬勞動力,作為一種新的生產要素可以促進生產力的提高,降本增效;二是創造新的需求和增長點,促進經濟的創新。
日前,捷通華聲董事長、CEO武衛東在出席清華企業家協會(TEEC)活動中,做了《全方位AI助推新基建,驅動產業智能化轉型》主題分享,就人工智能之于新基建核心價值進行了解讀,并介紹了捷通華聲基于靈云全方位人工智能開放平臺在技術、產品與服務層面的最新進展和助推各行業智能化升級的成果。
以下為分享實錄(有整理):
大家好,很高興今天有這樣一個機會和各位T友分享。
今年正好是捷通華聲成立20周年。
在人工智能這條路上,我們經歷了很多,由最開始人工智能概念普及,到技術突破(深度學習)掀起新一輪浪潮,今年上半年的科技戰疫、復工復產,再到這次作為新基建7大領域之一被寫入政府工作報告,每個階段我們都有參與,有些環節更是作為推動者在做。
今天要和大家分享的,就是這些年我們在人工智能領域的一些經驗、心得和思考。
人工智能可以理解成讓機器具備人的各項能力的技術,是人的手眼感知的延伸,但本質上是工具而不是人力,是為人類所驅使的生產勞動工具。捷通華聲在創立之初便定位提供多項人工智能技術。
捷通華聲成立于2000年,是較早進入人工智能領域的企業,始終致力于讓機器能說會聽、能寫會看、能辨音會認人、能思考會判斷。
公司成立前十年是我們完成技術積累的十年。后來隨著數據爆發式增長、計算能力提升以及深度學習算法的成熟,人工智能開啟了第三次發展浪潮。
正是這期間,捷通華聲在2011年推出了國內首個定位于全方位人工智能技術的開放平臺——靈云,在這個平臺上承載了我們當時設計研發的智能語音、智能語義、智能圖像等多方面的人工智能技術。
現在回過頭來看,多項技術融合應用正是AI與各行各業交叉融合,實現產業智能化升級的基礎,這個也是新基建的特性之一。
經過近10年的發展,現在我們已經擁有語音識別、語音合成、自然語言處理、語義理解、聲紋識別、OCR、手寫識別、人臉識別、大數據分析等15項核心技術,通過靈云平臺向全產業開放。
目前,我們已經構建了全國范圍銷售與研發網絡,北京總部外,在上海、廣州、深圳、廈門、天津、成都、西安、武漢、長沙、新疆等地成立分公司,為各行業客戶智能化升級提供技術、產品和服務支持。
產學研融合發展,提升核心技術競爭力
捷通華聲的發展同時得到了母校(清華大學)的支持,2013年,清華大學產業基金投資捷通華聲,雙方建立靈云科技源自清華戰略合作。2014年,北京清華工業開發研究院與捷通華聲聯合創建清華靈云人工智能研究中心。2015年,清華海峽研究院與捷通華聲聯合創建人工智能研究中心,由張鈸院士出任研究中心首席科學家,清華大學教授張長水出任中心主任。
通過與清華大學的產學研合作,靈云AI技術學術研究保持著全球領先,各產品核心技術性能指標都具備很強的競爭力。
在深耕技術、服務產業的過程中,我們也獲得了一些成績和認可,先后獲得中關村高新技術企業認證、北京市高新技術企業認證、北京市級企業科技研究開發機構認證,2020年度北京市專精特新第一批名單。因為在今年上半年防疫抗疫、復工復產的突出表現,還入選2020中關村首臺(套)重大技術裝備試驗、示范項目。
期間,我們也有參與國家部委與相關行業組織的人工智能標準制定。國產化這一塊也在積極布局,完成與飛騰、兆芯、龍芯等主流處理器,麒麟、統信等主流操作系統,華為鯤鵬云服務的兼容性互認證,支持多元異構環境使用。
還有一些行業協會和媒體的認可。
人工智能之于新基建核心價值在于賦能
工信部數據顯示,上半年軟件和信息技術服務業實現收入同比增長6.7%,正是人工智能、5G、物聯網等技術和傳統產業相融合,由產業質變帶來的經濟量變。
在我看來,人工智能技術主要通過兩方面進行產業賦能:一方面它能夠創造虛擬勞動力,作為一種新的生產要素可以促進生產力的提高,降本增效;二是創造新的需求和增長點,促進經濟的創新??偨Y下來就是開源節流。
這次政府提出新基建,無論信息基礎設施還是融合基礎設施都繞不開人工智能。人工智能被譽為云端大腦,依靠5G高速公路傳來的信息學習和演化,并通過工業互聯網連接人和物,推動社會經濟向數字化、智能化轉型,溢出效益明顯。
目前,人工智能已經在眾多垂直領域實現應用,較為成熟的領域包括金融、電信、交通、能源、政務、醫療等,而且應用場景越來越多,需求也越來越踴躍。
通過靈云平臺,我們將語音識別、語音合成、語義理解、自然語言處理、OCR等AI能力輸出,讓各個行業能夠快速將人工智能技術引入到實際業務中,實現AI與細分場景的結合,完成產業智能化升級。這也是捷通華聲的愿景——賦能百業,共享AI未來。
十五項自主研發的AI技術全面開放
基于人工智能發展趨勢和市場需求,捷通華聲也在持續研發并逐步向市場開放更多的人工智能技術,這里是我們目前在靈云平臺推出的15項人工智能核心技術,主要覆蓋智能語音、智能語義、智能視覺和大數據分析四個層面。
像語音合成和圖像處理,捷通華聲是國內最早投入研發并實現商業化的企業。最新建成的大興機場,大家在高鐵站聽到的站內廣播,08年奧運會,上海世博會,都用了捷通華聲語音合成的聲音。經過多年技術迭代,不僅聲音更逼真,擁有男聲、女聲、童聲、卡通等不同音色,嚴肅、甜美等不同風格,更支持維/藏等少數民族語言及多國語言的語音合成。
也是得益于先發優勢和成熟的產學研合作體系,我們不僅擁有自主知識產權的核心技術還形成了自己的行業壁壘,就是海量語料、行業知識庫和業務場景。
大家現在會覺得從事人工智能這方面的公司越來越多,但實際上擁有核心技術的企業并不多。
一個原因就是從人工智能發展角度來講,除了算法算力,還需要數據/場景等關鍵要素,而這些恰恰是需要一個長期的積累,需要一個韌性。這也是人工智能企業與互聯網經濟、共享經濟或者一些新的商業模式最大的不同。
舉一個例子,語音識別,算法擺在這里,要做一個通用模型可能很容易,但是深入到b端企業,深入到行業場景里面,就需要做很多工作,單數據加工處理這一塊,我們在全國就有幾千人的外包團隊在做。沒有深耕這個行業的決心和一定的韌性是無法做到長期發展的。
由技術層到平臺層、應用層,多維度服務產業智能化升級
當然,有了核心技術還不行,更多的還是通過平臺對外展示,與實際業務場景相融合。這些年來,我們通過靈云平臺包括私有云平臺和公有云平臺輸出各項能力,與不同行業業務系統進行快速對接,實現AI與細分場景的結合。
在尋求底層技術突破的同時,捷通華聲也在進行更加契合客戶需求的產品化開發,針對客戶的特殊需求,推出了不同形態的應用和解決方案,實現了在技術層、平臺層和應用層的全產業鏈布局。
技術層是以我們完全擁有自主知識產權的15項AI能力在支撐,中間平臺層是我們的私有云和公有云平臺,采用開放式架構設計,客戶可以通過標準的開放接口,靈活調用單項或組合多項AI能力,滿足客服、營銷、運營、管理、生產等不同業務部門的需求。
靈云AICC全智能客服助力智慧金融、智慧政務建設
在應用層,我們有在國內率先推出的全智能客服解決方案,針對客服中心和呼叫中心的一整套智能化解決方案,包括智能客服、智能語音導航、智能外呼、智能語音質檢和實時坐席輔助。
在這一塊我們已經積累了豐富的落地經驗,客戶覆蓋銀行、保險、能源、電信和政府機構,并且每年都保持一個較高的增長率。
今年上半年,靈云全智能客服解決方案在科技戰疫和復工復產過程中也發揮了很大作用。我們推出的智能外呼疫情防控機器人,實現了疫情通知、患者跟蹤、流動人員排查、本地居民排查等場景呼出。相比純人工的方式,不僅信息傳遞效率更高,同時能夠避免工作人員線下調研、排查被感染的風險。
這套系統也登上了工信部科技司的疫情防控信息公式平臺,同時也獲評了2020中關村的中關村首臺(套)重大技術裝備試驗、示范項目。
靈云全智能客服解決方案同時服務于大多數銀行機構,在響應央行、財政部、銀保監等五部門聯合提出的加強全國范圍特別是疫情嚴重地區的線上服務,引導企業和居民通過互聯網、手機APP等線上方式辦理金融業務要求過程中,起到了有力的支撐作用,也獲得了我們客戶的一致好評。
例如,我們為某股份制銀行搭建的智能語音導航系統,日接聽量20萬通,回答準確率91%,轉人工比例下降至20%,轉人工等待時長下降30%,轉人工坐席接起率提升至99.78%。實現了企業客戶服務門戶的智能化和扁平化,成功避開了防疫工作中無法集中辦公為客服中心帶來的挑戰,同時提升了服務效率和服務體驗。
這套全智能客服解決方案在智慧政務中也有廣泛應用,我們已經為多省市建設了12345智能服務熱線。智能機器人能夠提供7*24h多渠道智能化服務,將市民電話精準轉接給責任部門,并對服務質量進行智能監督;為政務人員提供智能外呼機器人,進行社情精準調研;通過對服務大數據分析,來輔助政務決策和精準優化政府服務。
這樣的案例還有很多,這只是智慧城市的其中一個很小的模塊,最近我們在一些城市也展開一些更多工作。
高效轉寫、字幕投屏,打造數字時代智能會議系統
智能行業解決方案,包括我們針對多人會話場景推出的智能會議系統,它能夠提供會議發言的實時轉寫,字幕投屏展示,會后能夠快速的輸出會議紀要。這套方案在多地黨政系統、企事業單位都有應用。我們通過搭建一套系統,面向大概有300個委辦局、包括下面的地級市都能夠使用,因為是統一部署,也更好管理。
靈云智聲一體機是我們今年重點推出的一款高度集成軟硬一體化的產品,具備多語種識別及互譯(中-英/日/韓、漢-維/藏等),提供智能語音輸入法,字幕、投屏、音視頻轉寫、實時翻譯、Office語音模塊等特色功能,適用于日常辦公、演講匯報、審訊問詢、多人會議等多種語音場景。
除了功能多,另一個特點是所有運算都是在本地端完成的,不需要聯網,數據存儲在本地端也更安全。
讓每個人都能享受人工智能帶來的輕松與便捷
AIoT智能物聯網這塊,像華為盒子、智能電視、導航、車載輸入法等很多都是由我們提供的解決方案。
在公有云這方面,我們通過向開發者提供AI能力,這么多年下來,已經積累了10萬+開發者,服務用戶超過5個億。比如出國翻譯官,官方數據顯示有幾千萬用戶,日活在20萬,就是用了我們的AI能力。
我們也推出了自己的c端產品,靈云聽語,支持實時將聲音轉為文字和離線音頻轉寫,很受記者、政府公務員、白領、教師和學生歡迎,目前也處在一個快速發展階段。
賦能百業,共享AI未來
人工智能作為新時代備受關注的技術,其本質是科技進步對所有產業的提升,而并非單獨一個新興行業,只有當人工智能技術在中國真正普遍地應用于傳統行業,而不僅僅屬于科技巨頭時,其經濟潛力才會充分彰顯。
這就需要上下游產業鏈的共同努力,捷通華聲始終堅持賦能百業共享AI未來發展愿景,將繼續發揮在人工智能領域的優勢,與合作伙伴優勢互補,以工匠精神為產業智能化提供優質的產品和服務。
最后感謝大家的聆聽,歡迎大家來捷通華聲參觀指導,一起探索AI未來。