微信時代,在緊張的辦公中,收到對方大段一分鐘長的音頻時,內心其實是崩潰的。于是,越來越多人開始選擇語音輸入,輕松了自己,更方便了他人。
然而選擇語音輸入的另一個問題就是:不得不面對的語音識別速度。一旦網絡環境稍差,識別速度就堪稱“龜速”,而在沒網的情況下,就只能面對著“網絡在打盹兒,稍后在試吧!”而興嘆了。
近期,捷通華聲針對靈云語音識別SDK進行全新升級,更改vad引擎并優化了效果,大幅提升了識別率以及識別速度,并增加了ASR的雙路識別功能,更能保障識別的準確率與成功率。
除了語音識別SDK,靈云語義理解SDK、語音合成SDK也得到了相應的升級優化,從而實現更快、更優質的人機語音交互。開發者登陸靈云平臺(www.aicloud.com),進入開發者社區,即可下載相關SDK,讓你的APP不再忍受語音交互的等待之苦。
靈云語音識別 中國智能語音領軍品牌
捷通華聲作為國內最早從事中文智能語音技術研究與應用的高新技術企業,擁有行業頂尖的靈云語音識別技術。識別技術采用行業領先的深度學習算法,具備了識別率高、響應速度快、支持話者分離和智能語音端點檢測,口音和方言適應能力強等優點。
除支持中文識別已達國內領先水平外,靈云語音識別還支持英文、維語、粵語等多語種識別,其中,中文普通話,識別率可達97%以上,實時率在0.3以下,并可通過語言模型定制和聲學模型定制,在短時間內大幅提升專業領域的語音識別率。
結合靈云語音識別技術,捷通華聲在靈云平臺上為開發者提供的靈云語音識別SDK可支持HTTP、Socket、WebService以及MRCP接口,且支持詞表識別、語法識別和自由說識別,可以在用戶終端進行語音識別,也可以在云端進行語音識別,并能根據不同領域的需求進行個性化定制。
大規模語音實現高效、實時、精準轉寫
靈云語音識別技術的快速進步,給企業創新發展、提高效率帶來了新機遇,讓更多企業享受到靈云人工智能技術帶來的方便與快捷。
新升級的靈云語音識別SDK,以及靈云語義理解SDK、語音合成SDK、靈云種子,配合捷通華聲專門推出的靈云麥克風陣列技術,不僅能夠輕松實現電視、空調、音箱、機器人、車載系統的遠場精準語音交互,也讓交互等待時間不再漫長、卡頓。
在各類會議的文字直播中,新升級的靈云語音識別能更加實時、高效地將會議情況進行文字轉播,從而達到同步轉寫的效果,庭審記錄中將庭審現場實時記錄轉寫下來,大幅減輕速記員等文字工作者的工作量,提升了信息的傳播效率。
在客服、呼叫中心領域,語音識別技術將坐席與用戶的電話實時轉寫為文字,識別速度及準確率的提升,讓溝通與文字的轉寫變得更為同步。在靈云智能語音導航系統以及靈云智能外呼機器人上,這一升級體現的更為明顯,接打外呼機器人或機器人客服的電話溝通交流時,我們再也不用為機器人長時間的“思考”而苦苦等待了,用戶體驗得到顯著提升。
未來,捷通華聲將進一步深化與清華大學“靈云科技源自清華”的戰略合作,不斷提升靈云語音識別、語義理解、語音合成、人臉識別等各項技術的能力,讓大眾能夠體驗到人工智能帶來的方便與快捷。開發者可以到靈云平臺上下載體驗包括靈云語音識別、語義理解、語音合成、人臉識別、OCR識別、聲紋識別等多種能力在內的SDK。