婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁(yè) > 知識(shí)庫(kù) > 多語言語音合成和跨語言語音克隆

多語言語音合成和跨語言語音克隆

熱門標(biāo)簽:中國(guó)地圖標(biāo)注澳門特別行政區(qū) 電銷外呼防封系統(tǒng)多少錢 3D地圖標(biāo)注app 遼寧智能電銷機(jī)器人廠家 怎么縮小百度地圖的標(biāo)注圖標(biāo) au電銷機(jī)器人 外呼系統(tǒng)怎么調(diào)電話 廣西電商外呼系統(tǒng)廠家 東莞外呼系統(tǒng)怎么樣
  場(chǎng)景描述:語音合成解決的主要問題就是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,涉及語言和語音兩部分。TTS技術(shù)(又稱文語轉(zhuǎn)換技術(shù))隸屬于語音合成,它是將計(jì)算機(jī)自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)榭梢月牭枚?、流利的漢語口語輸出的技術(shù)。
  關(guān)鍵詞:多語言語音合成和跨語言語音克隆
  我們知道目前端到端神經(jīng)TTS模型已經(jīng)可以實(shí)現(xiàn)對(duì)說話者身份和未標(biāo)記的語音屬性(如韻律)的控制。當(dāng)使用language-dependent輸入表示或模型組件時(shí),特別是當(dāng)每種語言的訓(xùn)練數(shù)據(jù)量不平衡時(shí),擴(kuò)展這些模型以支持多種不相關(guān)的語言并非易事。例如,在漢語和英語等語言之間的文本表示沒有重疊。此外,收集雙語者的錄音也很昂貴。因此,最常見的情況是訓(xùn)練集中的每個(gè)說話者只說一種語言,所以說話者的身份與語言是完全相關(guān)的。這使得在不同語言之間語音轉(zhuǎn)換變得困難。此外,對(duì)于外來詞或共享詞的語言,如西班牙語(ES)和英語(EN)中的專有名詞,同一文本的發(fā)音可能不同。當(dāng)經(jīng)過簡(jiǎn)單訓(xùn)練的模型有時(shí)為特定的說話者生成重音時(shí),這就更加難以捉摸。
  針對(duì)以上問題,最近學(xué)者們提出了一種基于Tacotron(中文語音合成)的多人多種語言文本到語音(TTS)的合成算法。
  這種算法能夠在多種語言中生成高質(zhì)量的語音。此外,模型是能夠跨語言傳遞聲音。模型結(jié)構(gòu)采用基于注意力機(jī)制的序列到序列模型,根據(jù)輸入文本序列生成倒譜梅頻(log-mel,來自MFCC梅爾頻率倒譜系數(shù))圖幀序列。
  該模型是通過使用音位輸入表示來設(shè)計(jì)的,以激勵(lì)跨語言的模型容量共享。它還包含了一個(gè)對(duì)抗性的損失,以幫助理清它的說話者表示。通過對(duì)每種語言的多名使用者進(jìn)行訓(xùn)練,加入自動(dòng)編碼輸入,并在訓(xùn)練期間來幫助穩(wěn)定注意力,從而進(jìn)一步擴(kuò)大了訓(xùn)練規(guī)模。
  經(jīng)過計(jì)算,實(shí)現(xiàn)了語音克隆和重音控制效果的可視化。嵌入向量集群聚在一起(左下角和右下角),這意味著當(dāng)說話者的原始語言與嵌入的語言匹配時(shí),無論文本語言是什么,都會(huì)有很高的相似性。然而,使用文本中的語言ID(正方形),修改說話者的口音使其能夠流利地說話,與母語和口音(圓形)相比,會(huì)損害相似性。
  該模型對(duì)三種語言的高質(zhì)量語音合成和語音訓(xùn)練的跨語言傳輸具有重要的應(yīng)用潛力。例如,不需要任何雙語或并行語言的訓(xùn)練,它就能夠使用英語使用者的聲音合成流利的西班牙語。此外,該模型在學(xué)習(xí)說外語的同時(shí)還會(huì)適量調(diào)節(jié)口音,并對(duì)代碼切換有基本的支持。
  在未來的工作中,學(xué)者們還將計(jì)劃研究擴(kuò)大利用大量低質(zhì)量培訓(xùn)數(shù)據(jù)的方法,并支持更多的使用者和語言。
  論文鏈接:https://arxiv.org/pdf/1907.04448.pdf

標(biāo)簽:開封 常德 廣州 柳州 新疆 鎮(zhèn)江 聊城 遼源

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《多語言語音合成和跨語言語音克隆》,本文關(guān)鍵詞  多,語言,語音,合成,和,跨,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《多語言語音合成和跨語言語音克隆》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于多語言語音合成和跨語言語音克隆的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    主站蜘蛛池模板: 临颍县| 阜阳市| 五寨县| 安新县| 博罗县| 调兵山市| 呼玛县| 安龙县| 镇平县| 本溪| 桐城市| 泰安市| 峨眉山市| 监利县| 高阳县| 康平县| 界首市| 安塞县| 什邡市| 永善县| 青浦区| 嵊泗县| 沧源| 莱西市| 连云港市| 甘泉县| 新源县| 锡林浩特市| 阿克陶县| 青阳县| 尖扎县| 宁河县| 邻水| 文成县| 登封市| 昔阳县| 许昌市| 应用必备| 临高县| 铜鼓县| 化州市|