婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 多語種機器翻譯引擎 助力專利審查和檢索的“ 神器”

多語種機器翻譯引擎 助力專利審查和檢索的“ 神器”

熱門標簽:佛山400電話怎么申請 躍順地圖標注服務商 泗陽正規電話機器人服務商 電銷智能機器人介紹作文 商戶地圖標注收騰訊地圖標注商戶 覓呼電話機器人 公司企業地圖標注好處 電話機器人原理是什么 商家地圖標注賺錢店
來源: 中國知識產權報/中國知識產權資訊網
中國專利信息中心機器翻譯團隊在討論問題。(資料圖)
中國專利信息中心工作人員在編寫代碼。(資料圖)

  實時翻譯、批量翻譯、語種自動識別、翻譯記憶……提起擁有這些功能的“神器”——多語種專利文獻機器翻譯引擎(下稱多語種機器翻譯引擎),用戶無不豎起大拇指。

  實際上,這款“神器”是中國專利信息中心(下稱信息中心)依據專利文獻特點對通用機器翻譯引擎的定制化產品。自2017年起,信息中心引入神經網絡機器翻譯技術,打造多語種機器翻譯引擎,為專利信息加工、傳播、咨詢等多項業務提供了有力支撐。此外,該引擎也幫助審查員和社會公眾跨越語言障礙,更便捷地從文獻中獲取有價值的信息,進而促進知識產權信息的高效利用,充分發揮了知識產權信息對經濟和社會發展的驅動作用。

  打造系統 攻克難題

  近年來,在知識產權促進創新高質量發展的背景下,知識產權信息日益成為經濟和社會發展的重要支撐,成為國與國之間競爭的戰略資源。充分挖掘知識產權信息的價值,發揮其對經濟高質量發展的驅動作用,是建設知識產權強國和科技強國的必經之路和重要抓手。

  而具體到我國知識產權特別是專利事業發展實踐中,專利申請數量的快速上升,給專利審查帶來了巨大的壓力和挑戰。與此同時,專利權人、創新主體和社會公眾也對高質量的機器翻譯有更迫切的需求。據介紹,在多語種機器翻譯系統建設之前,神經網絡機器翻譯技術憑借其優異的翻譯性能成為通用領域機器翻譯的主流技術,為提升翻譯質量和效率、滿足應用需求提供了技術支撐。

  “然而,神經網絡機器翻譯存在詞表受限、先驗知識運用不足、語料匱乏和稀缺資源語種的翻譯效果不理想等問題,同時由于專利文獻涉及的語種多、領域廣、專業術語豐富,通用型的機器翻譯系統亦不能滿足高質量和高效率的專利文獻翻譯需求。不僅如此,專利文獻內容廣博、科技術語多、句法結構復雜、符號應用廣泛等特點導致機器翻譯技術在專利文獻翻譯實踐中面臨諸多挑戰,專利文獻數據的多源異構性、數據格式多樣以及數據噪聲等問題也對機器翻譯質量造成不利影響。”信息中心相關負責人在接受本報記者采訪時表示。

  在解決上述難題的過程中,信息中心在知識產權信息技術開發利用領域的優勢逐漸體現了出來。由于長期承擔專利文獻翻譯工作,信息中心積累了豐富的專利文獻翻譯經驗和數據資源優勢,在采用先進的神經網絡機器翻譯等人工智能技術的同時,結合自身擁有的高質量平行語料、專業化的數據分析團隊和多語言翻譯人才,不斷探索打造適用于專利領域的多語種機器翻譯系統。

  基于上述背景,2019年,適用于專利領域的多語種機器翻譯系統正式問世。據了解,該系統實現了專利文獻機器翻譯全領域覆蓋,可以為審查員和社會公眾提供高質量的機器翻譯結果,并能夠根據客戶需要提供精準化、定制化、專業化的機器翻譯服務。

  優化功能 提升質量

  據介紹,信息中心在引擎定制化建設過程中主要從語料建設與優化、模型訓練及調參、引入外部記憶以及工程性打磨四個方面進行。而這四個方面,各有其必要性:語料資源建設與優化的目的是獲得高質量的訓練語料,高質量的語料是高性能多語種神經網絡機器翻譯系統的基礎;模型訓練及調參主要是通過迭代訓練找到最優的模型和參數;引入外部記憶,包括引入多語種術語詞典、記憶庫等,確保專有名詞和專利文獻術語翻譯準確;工程性打磨主要是根據專利文獻數據特點,制定數據前后處理整體解決方案,進而提升機器翻譯性能和質量。

  記者在采訪中了解到,作為信息中心依據專利文獻特點對通用機器翻譯引擎的定制化產品,多語種機器翻譯引擎具有實時翻譯、批量翻譯、語種自動識別、翻譯記憶、用戶詞典等功能,支持中、英、德、法、日、韓、俄等多個語種的翻譯,支持多業務場景應用,支持本地化部署以及云平臺部署。

  據悉,多語種機器翻譯引擎的專利文獻翻譯質量較高,準確性較通用引擎顯著提高。經國家知識產權局及多地審查協作中心審查員廣泛試用,效果良好。

  發揮優勢 持續探索

  據信息中心相關負責人介紹,信息中心在深入分析專利領域機器翻譯應用問題的基礎上,采用“技術+領域化+平臺+可擴展”的設計思路,適用于專利領域的多語種神經網絡機器翻譯系統,并進行本地化部署及與多應用系統的對接,可在保證數據安全的前提下實現對多語種專利文獻信息快速、準確的翻譯,擴大文獻檢索范圍和提升瀏覽效率,為專利工作者和社會公眾進行專利文獻檢索提供助力。

  “目前,多語種機器翻譯引擎已應用于國家知識產權局新一代智能化專利審查和檢索系統,開展多語種、多類型、多格式的海量專利文獻數據的翻譯,涉及美、日、韓、德、法、英等十余個國家、組織和地區的專利全文及非專利全文數據,翻譯質量得到用戶肯定。”該負責人說。

  當然,從技術發展成熟度來看,雖然神經網絡機器翻譯技術相較于基于規則、統計的機器翻譯技術有較大的飛躍,翻譯質量大幅提高,但是由于神經網絡機器翻譯為數據驅動方法,目前在資源稀缺語種的翻譯效果以及深層網絡計算資源優化配置等方面尚存改進空間。

  信息中心相關負責人表示,展望未來,如何持續致力于機器翻譯技術的深入研究、提升機器翻譯質量、拓展語言種類及應用場景、以系統功能和技術能力的升級優化助力專利審查和檢索質量和效率的提升、為社會公眾提供高質量的專利信息服務等仍是需要進一步研究的問題。“神器”的神奇,仍將等待開發設計者和用戶一起不斷探索與發掘。




標簽:淄博 呼倫貝爾 西藏 南寧 江蘇 大連 烏海 云南

巨人網絡通訊聲明:本文標題《多語種機器翻譯引擎 助力專利審查和檢索的“ 神器”》,本文關鍵詞  多語種,機器翻譯,引擎,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《多語種機器翻譯引擎 助力專利審查和檢索的“ 神器”》相關的同類信息!
  • 本頁收集關于多語種機器翻譯引擎 助力專利審查和檢索的“ 神器”的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 徐闻县| 通山县| 安新县| 怀远县| 札达县| 图片| 白朗县| 临海市| 乡宁县| 三台县| 盐城市| 富蕴县| 芜湖县| 大连市| 寻乌县| 荥经县| 安仁县| 二连浩特市| 奉化市| 桃园市| 涟水县| 遂宁市| 湘潭县| 六枝特区| 延川县| 北京市| 葵青区| 宜兰市| 盐亭县| 桑植县| 宣化县| 宿州市| 安顺市| 修文县| 博客| 威海市| 沙坪坝区| 枣阳市| 孟津县| 东源县| 霸州市|