本篇文章給大家談談電話機器人架構組成,以及電話機器人是什么對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。
本文目錄一覽:
1、電銷機器人是什么?
2、想自己做機器人外呼系統,線路,怎么組裝
3、無線電話是靠什么工作的,電話里的主要組成部分是那個零件
4、騰訊算法高級研究員陳松堅:智能問答技術及其應用
5、電話機器人是什么?
電銷機器人是什么?
電銷機器人,是一種AI機器人智能語音呼叫系統,是一種智能電話機器人,模仿真人打電話,真人語音,每天拔打電話量高達2000到3000不等,工作效率非常高。當今房地產、金融、貸款、保險、裝修等行業都非常適合使用電銷機器人。
為各電銷行業提供一款全自動化的智能電銷機器人
1、可以自動直找客戶號碼,自動找手機號碼;
2、智能設置自動執行每天撥打任務安排,實現自動撥打號碼;
3、支持本人語音話術錄制,實時訓練全程智能應答,真實真人智能交流,介紹產品等公司相關業務;
4、語境語意即時算法,準確捕捉客戶意圖,實現自動判斷智能回復;
5、靈活多變的締結方式,自動引導客戶需求;
6、綜合分析通話內容,智能標識用戶需求,自動對接人工坐席,實現自動轉接;
7、根據預設客戶意向標注,自動匹配判斷客戶意向需求;
8、通過過程自動錄音,自動歸類,自動統計時長,自動推送工作報告,實現客戶智能分類管理;
9、自動設定約訪,回訪時間,自動啟動電話回訪或提醒人員根據,實現意向客戶自動跟蹤.
想自己做機器人外呼系統,線路,怎么組裝
自己做機器人外呼系統線路和組裝的方法分別是:
1、線路:由于機器人外呼系統線路難以自己研制只能選擇運營商線路。提供方包括三大運營商、集成線路商。這是我們打電話出去要交電話費,必須涉及的供應商。
saas服務平臺。即用戶可以注冊、登錄、繳費、上傳呼叫列表、發起外呼任務、外呼結果查看的網站。這個是終端用戶唯一可以看得到的前端界面。
2、組裝:以呼叫中心技術系統為基礎,將計算機的信息處理功能、數字程控交換機的電話接入和智能分配、自動語音處理技術、 Internet技術、網絡通信技術。
商業智能技術與業務系統緊密結合在一起,將公司的通信系統、計算機處理系統、人工業務代表、信息等資源整合成統一、高效的服務工作平臺 。
機器人外呼系統的AI能力對接是:
在具體落地中,這個領域的常規參與者通常具備呼叫中心能力或者AI能力其中一種,而主要的對接點也就在于AI能力與呼叫中心設備去對接,而ASR/TTS與呼叫中心設備對接的常規協議主要是mrcp/sip。
媒體資源控制協議(Media Resource Control Protocol, MRCP)是一種通訊協議,用于語音服務器向客戶端提供各種語音服務(如語音識別和語音合成)。有兩個版本的MRCP協議,版本2使用SIP作為控制協議,版本1使用RTSP。
實際對接的時候,會遇到不少技術問題,有的呼叫中心廠商會要求ASR/TTS引擎做私有云部署,這樣避免了內外網穿透時防火墻的諸多設置和語音流的時延。這對基于語義起家(并購買語音能力)的公司是一個小小的難題。
無線電話是靠什么工作的,電話里的主要組成部分是那個零件
一、手機的工作原理:
一般來說,我們普通用戶只要學會如何使用好手機就可以了,對于其具體的工作原理不必仔細深究;然而在使用手機的過程中,由于各種因素的影響,手機不可避免地要出現故障,如果每次遇到故障哪怕是最微小的,都送到專業維修店去修理,您可能會覺得麻煩。如果您有相當的電器知識的話,您可能想自己學著修理,但要學修理,必須先熟悉手機的工作原理,只有這樣才能判斷發生的故障原因,并找出相應的解決方法。同時,了解手機的工作原理對于普通人來說也可以作為一種知識的儲備。為了能幫助這些喜愛手機的用戶快速學會修理,筆者就以摩托羅拉手機為例,來詳細介紹一下手機到底是如何工作的。
手機之所以能相互通信,筆者認為它是由三部分協調工作的結果,這三部分分別為射頻部分、邏輯部分和電源部分,要了解手機的工作原理其實只要了解這三部分是如何工作的就可以了,下面筆者就對這三個部分的工作原理進行分別地介紹。
射頻部分
通常射頻部分,又是由接受信號部分和發送信號部分組成。手機在接受信號時,首先利用天線把接收到的935-960MHz的射頻信號,經U400、SW363,將發射信號的接收信號分開,使收發互不干擾。從U400的第四腳輸入第五腳輸出,進入接收前端回路。U400的工作狀態受第三腳電位的控制,而第三腳電位又受到來自CPU的TXON、RXON信號的控制。經過天線開關的射頻信號首先經過帶通濾波器FL451的濾波,再送入高頻放大管Q418進行放大,Q418的輸出經FL452濾波后送Q420混頻管進行混頻。而本機振蕩信號由RXVCO產生,并以FL453濾波后送Q420的基極進行混頻,取其差額,從Q420的集電極輸出153MHz的中頻信號,經FL420濾波后得到153MHz純凈的中柴油機信號,現經Q421放大后送U201的31腳,153MHz的中頻信號與153MHz的載波信號在32D53內解調產生RXI和RXQ模擬基帶信號,經U201的46#和48#送U501的14#和15#。在U501內經A/D轉換后送數字信號處理器做進一步的處理。153MHz的載波由U201的41#、42#、43#接外圍電路所構成的306MHz振蕩電路,形成306MHz卉波信號,經二頻后形成153MHz載波。對于發送部分,從501的21#、22#、23#、24#輸出的TXIN、TXIP、TXQN、TXQP發射頻帶信號進入U201的61#、62#、63#、64#。U201的6#、7#、10#外接一個216MHz的VCO,產生216MHz的載波信號,該信號經U201內的分頻器分頻產生108MHz的發射中頻信號。四路調制信號在U201內完成108MHz載波調制從第4腳輸出到U300的4#。U300完成發射取樣信號與TXVCO相溫柔頻,取其差額得108MHz信號與4#輸入的TXIF鑒相,產生鑒相誤差電壓,從第8腳輸出去控制變容二極管CR300的容量來改變TXVCO的振蕩頻率,從Q300的C極輸出890-915MHz的發射信號經Q301前級放大和Q302推動后進入功放Q302,放大后的信號進入天線U400的第1腳,再從U400的4#送天線發射出去。
邏輯部分
在邏輯部分,接收的RXI、RXQ模擬基帶信號在調制解調器U501內部完成D/A轉換、解密及自適應均衡后將數字基帶信號從U501的6#送入CPU的10#,在CPU內進行信道解碼,去掉糾錯碼源以及取實控制信息以后,恢復的話音數據流經數據線和地址線,傳送到語音器U801進行解碼。產生的數字話音信號從U801的78#送到PCM解碼器U803的8#。數字話音信號在PCM解碼器內完成減壓以及A/D轉換,再通過數字音量定位器,對接收信號、音量進行調整,再由U803的4#,輸出模擬音頻信號到U900的6#和21#。6#輸入的振鈴信號,經內部的振鈴驅支放大以后,從U900的4#、5#輸出去驅動振鈴器發間音頻信號,從21#輸入,經內部的音頻放大器以后,從19#、20#輸出放大的話音信號去推動聽筒發聲。 當我們用戶在講話時,話音經聽筒的聲電轉換以后送入電源集成電路U0-的9#,經內部的音頻放大以后,從10#輸出放大的模擬音頻信號。該信號在送到PCM編解碼器U803的18#在U803內部完成PCM編碼。從13#輸出PCM信號送到語音編碼器801的89#,在U801內進語音數據線和地址線將話音數據液流磅到中央處理器U701,話音數據流在U701完成信道編碼以后,經U701的11#送到調制解廟器U501的4#,信號在U501內進行D/A轉換,加密等處理以后,將產生的四路調制信號TXIP、TXIN、TXQP、TXQN送到收發中頻電路U201,以產生發射中頻ITX、IF信號。
電源部分
至于電源部分,我們一旦給手機裝上電池以后,電子Q999打通;同時32D54的48#與電源正極接通,此時我們如果再按一下開機鍵,U900的24#變為低電平,U900的穩奪輸出四路電壓分別為R275V、L2.75V、R4.75V、L5.0V。第30#產生復位信號和第27#產生開機申請信號。由32D53和13MHz晶體以及變壓二極管共同構成13MHz時鐘振蕩器產生13MHz時鐘,在32D53內部整形和放大以后從第59#輸出送緩沖接口電路U703的17#,又從U703的第37#送CPU的50#送開機維持信號到U900的29#,維持正常開機。另外Q202、Q203的集電極電壓均為2.75V,供給32D53內部接收或發射電路的電源。U900第3#送出的L5.0V給負電壓產生電路供電。版本,SIM卡和PCM編解碼器U803也是L5.0V供電。U900第28#送出的R2.75V電壓給所有邏輯模塊供電。U900第28#送出的2.75V電壓供給射頻部分。U900第41#送出的R4.75V電壓給收發中頻電路32D53代電,U900第37#輸出的VXW轉換電壓給Q202和Q203的發射極供電。
由于各個手機的型號和出產廠商不一樣,上面介紹的工作原理可能不適用于某些手機,但大致的工作流程應該是一樣的。
二、手機制造相關知識
現在的手機已經漸漸脫離了單純通訊工具的身份,逐漸轉變成為一個多媒體和信息的終端設備,未來日常的溝通、娛樂、理財等活動,都是可以透過手機來進行。當大家在每一次看到一部新奇而又擁有高性能、鮮亮的外觀設計的手機出現時,各位是否有這樣的好奇心,這樣的手機到底是怎么設計和制造出來的呢?
所以今天我們嘗試用一個技術的客觀角度,來簡單描述手機設計部門的構造與及部門與部門之間的關系,最后向大家展示手機由制造到面世前的種種測試,好讓大家更進一步了解手機,更加珍惜你的愛機,或許你日后不會輕易的更換它了吧!
一、手機的設計流程
用一個較簡單的闡釋,一般的手機設計公司是需要最基本有六個部門:ID、MD、HW、SW、PM、Sourcing、QA。
1、ID(Industry Design)工業設計
包括手機的外觀、材質、手感、顏色配搭,主要界面的實現與及色彩等方面的設計。
例如摩托羅拉“明”翻蓋的半透明,諾基亞7610的圓弧形外觀,索愛W550的陽光橙等。這些給用戶的特別感受和體驗都是屬于手機工業設計的范疇,一部手機是否能成為暢銷的產品,手機的工業設計顯得特別重要!
2、MD(Mechanical Design)結構設計
手機的前殼、后殼、手機的攝像鏡頭位置的選擇,固定的方式,電池如何連接,手機的厚薄程度。如果是滑蓋手機,如何讓手機滑上去,怎樣實現自動往上彈,SIM卡怎樣插和拔的安排,這些都是手機結構設計的范疇。繁瑣的部件需要MD的工作人員對材質以及工藝都非常熟識。
摩托羅拉V3以 13.9mm的厚度掀起了手機市場的熱潮,V3手機以超薄為賣點,因為它的手機外殼材質選擇十分關鍵,所以V3的外殼是由技術超前的航空級鋁合金材質打造而成。可以這樣說,特殊外殼材質的選擇成就了V3的成功。
另外有個別用戶反應在使用某些超薄滑蓋手機的時候,在接聽電話時總能感覺到手機前殼的左右搖動,這就是手機結構設計出了問題,由于手機的殼體太薄,通話時的揚聲器振動很容易讓手機的機身產生了共振。
3、HW(Hardware) 硬件設計
硬件主要設計電路以及天線,而HW是要和MD保持經常性的溝通。
比如MD要求做薄,于是電路也要薄才行得通。同時HW也會要求MD放置天線的區域比較大,和電池的距離也要足夠遠,HW還會要求ID在天線附近不要放置有金屬配件等等。可想而知一部內置天線的設計手機,其制造成本是會較一部外置天線設計的手機貴上20-25%,其主要因素就是天線的設計,物料的要求與及電路的設計和制造成本平均都是要求較高一些。
通常結構設計師(MD)與工業設計師(ID)都會有爭論,MD說ID都是畫家,畫一些大家做不出來的東西,而ID會說MD笨,不按他們的設計做,所以手機賣得不好。所以,一款新的手機在動手設計前,各個部門都會對ID部門的設計創意進行評審,一個好的ID一定要是一個可以實現的創意,并且客戶的體驗感覺要很好才行。當年摩托羅拉V70的ID就是一個很好的實現創意例子,后期市場的反應也不錯,而西門子的Xelibri的創意雖然也很好,也可實現,但可惜的是最終客戶的使用感覺并不好,所以一個真正好的創意,不但要好看,可實現,而且還要好用。
另外HW也會與ID吵架,ID喜歡用金屬裝飾,但是金屬會影響了天線的設計以及容易產生靜電的問題,因此HW會很惱火,ID/MD會開發新材料,才能應付ID的要求。諾基亞8800就是一個好例子,既有金屬感,又不影響天線的接收能力。
4、SW(Software)軟件設計
相對來說,SW是更容易為大家所理解,由于計算機的普及,讓我們最大程度地接觸了各種各樣的軟件,手機操作界面的模式,大家經常看到的手機九官格操作菜單的實現,這都是SW設計的范疇。
SW要充分考慮到界面的可操作性,是否人性化,是否美觀的因素。SW的測試非常復雜,名目繁多,SW的測試不僅只是在尋找Bug,一致性的測試、兼容性的測試等都是非常重要的項目,在目前“內容為主”的信息時代,軟件才是手機的最終幕后支柱,硬件的驅動是軟件來實現,軟件和硬件的工程師之間的沖突相信是不會比其它部門少,這種關系的繞來繞去,所以便需要有PM(Project Management)項目管理來協調了。
5、PM(Project Management)項目管理
大規模公司的PM都分得非常細致,比如TPM (Technologly Of Project Management),即專門管技術的PM,而普通的PM,只管理項目的進度各協調工作,PM這個部門通常存在于那些自己設計,自己生產,自己銷售手機的公司,AM(Account Manager)的職位恐怕大家都不陌生,作為客戶經理,對公司內部是代表客戶提出要求,對外則代表公司的整體形象,在兩者之間起著不可或缺的橋梁作用。
6、Sourcing資源開發部
資源開發部的員工要不停地去挖掘新的資源,如新材質、新的手機組件、測試器材等,當手機開始試產時,他們要保證生產線上所需要的所有生產物料齊備。
手機進行小批量試生產,考察的不僅是軟/硬件的成熟度,還包括考察生產工藝和生產的測試技術,有些手機在進行到這個階段時,卻通過不了這一關的話,最后是以失敗告終。于是這款新設計的手機便不會出現在市場上了,而投入的開發資金和人力卻付之流水,是一個極大的損失。
7、QA(Quality Assurance)質量監督
QA部門負擔起整個流程質量保證的工作,督促開發過程是否符合預定的流程,保證項目的可生產性,有很多新設計的手機,就因為碰上了不可生產的某種因素而放棄了。
生產一部手機不是在實驗室內做實驗那么簡單,一旦生產就是成千上萬部,要保證每一部產品的優質絕非一件簡單容易的事。生產一部手機的樣品和生產10萬部手機完全是兩碼子事。
舉例:中國的菜館出的都是樣品,麥當勞做的是產品,所以麥當勞可以做得很大,而且到目前為止,中國的菜館暫時還沒有做到像麥當勞的規模是事實,所以手機設計公司才會建立起很多流程來防止出現設計研制出來的手機卻不能投入生產的情況。
不僅如此,一款手機的成功上市,能夠賣個滿堂紅,仍然是需要與大眾手機用戶有親密的接觸,并且經過用戶的反饋以及快速的改善才能成功。
二、鮮為人知的手機測試項目
1、壓力測試
用自動測試軟件連續對手機撥打1000個電話,檢查手機是否會發生故障。倘若出了問題,有關的軟件就需要重新編寫了。所以有時候手機上會出現不同的軟件版本存在的情況,其實告訴大家一個秘密,手機的版本越多,這可以證明該手機在推出發售前,未經過充分的測試工作便發售了。
2、抗摔性測試
抗摔性測試是由專門的Pprt可靠性實驗室來進行,0.5m的微跌落測試要做300次/面(手機有六個面)。而2m的跌落測試每個面需各做一次,還仿真人把手機拋到桌面,而手機所用的電池,也要經過最少4m的高度,單獨的向著地面撞擊跌落100次而不能有破裂的情況出現。
3、高/低溫測試
讓手機處于不同溫度環境下測試手機的適應性,低溫一般在零下20攝氏度,高溫則在80攝氏度左右。
4、高濕度測試
用一個專門的柜子來作滴水測試,仿真人出汗的情況(水內滲入一定比例的鹽分),約需進行30個小時。
5、百格測試(又稱界豆腐測試)
用H4硬度的鉛筆在手機外殼上畫100格子,看看手機的外殼是否會掉下油漆,有些要求更嚴格的手機,會在手機的外殼上再涂抹上一些“名牌”的化妝品,看看是否因有不同的化學成分而將手機的油漆產生異味或者掉漆的可能。
6、翻蓋可靠性測試
對翻蓋手機進行翻蓋10萬次,檢查手機殼體的損耗情況,是用一部翻蓋的仿真機來進行,它可以設置翻蓋的力度、角度等
7、扭矩測試
直機用夾具夾住兩頭,一個往左擰,一個往右擰。扭矩測試主要是考驗手機殼體和手機內面大型器件的強度。
8、靜電測試
在北方地區,天氣較為干燥,手摸金屬的東西容易產生靜電,會引致擊穿手機的電路,有些設計不好的手機就是這么樣突然損壞了。進行這種測試的工具,是一個被稱為“靜電槍”的銅板,靜電槍會調較到10-15KV的高壓低電流的狀況,對手機的所有金屬接觸點進行放電的擊試,時間約為300ms-2s左右,并在一間有濕度控制的房間內進行,而有關的充電器(火牛)也會有同樣的測試,合格才能出廠發售。
9、按鍵壽命測試
借助機器以給設定的力量對鍵盤擊打10萬次,假使用戶每按鍵100次,就是1000天,相當于用戶使用手機三年左右的時間。
10、沙塵測試
將手機放入特定的箱子內,細小的沙子被吹風機鼓吹起來,經過約三小時后,打開手機并察看手機內部是否有沙子進入。如果有,那么手機的密閉性設計不夠好,其結構設計有待重新調整。
此外,手機的測試還包含了更多更離奇的測項目,比如把手機放在鐵板上打電話加以測試,由于此時磁場發生了變化,什么情況都會發生,例如尋找不到SIM卡等。
用鐵絲在手機底部連接器內撥來撥去,主要是要考慮到手袋內有鎖匙的情況下,是否會令手機出現短路的問題。
還有故意把充電器/電池反接測試,看看手機的保護電路設計是否能正常運作,靠近日光燈打電話的測試,人體吸收電磁波比例的測試,以及靠近心臟起博器打電話的測試等等,上述所提及的各種測試都是不可少的。
騰訊算法高級研究員陳松堅:智能問答技術及其應用
隨著人工智能的飛速發展以及廣泛落地應用,越來越多的設備將會被植入智能問答技術,人機交互場景隨處可見,智能問答在未來將會成為一個非常重要的入口。
騰訊小知憑借著業界領先的智能AI引擎算法和海量大數據倉庫,已將智能問答技術落地實施,并且經過大量的業務考驗和優化,知識點匹配度和準確率都已達到90%以上,在2018 年 GITC 全球互聯網技術大會上,騰訊小知榮獲年度互聯網最具價值產品獎。
騰訊小知算法負責人陳松堅也在會場發表了關于智能問答技術原理及其在To B場景下的應用的專題演講,從自己的角度為我們展現智能問答技術的最新成果。
他首先從智能問答是什么,為什么和怎么做的三個問題出發,闡明了他對當前智能問答技術的定位和價值,首先,現階段的智能問答是信息檢索技術的升級,是量變而未達到質變。但是無論在To B還是To C的場景下,當前的技術都能夠切實解決一些用戶的痛點,提升用戶體驗,是亟待推進和充滿想象的方向。
在回答怎么做這個問題時,他詳細介紹了幾種不同的問答機器人的實現路徑,包括單輪問答機器人,多輪問答機器人及閱讀理解機器人。其中重點闡述了單輪問答機器人的實現原理,包括字面匹配,詞向量匹配,深度語義匹配,遷移學習等技術。
此后他還分享了小知團隊將上述技術產品化的經驗,包括智能客服機器人和電話機器人兩大塊,主要分享了當前產品的形態,亮點和實際項目中取得的一些成果。
最后,他簡單總結了小知目前完成的工作以及就智能問答的發展提出了自己的幾點看法。
--------------------------------------------------------------
以下是演講稿全文:
各位下午好,很高興今天能在這里給大家做分享報告。先介紹一下,我們騰訊小知是致力于為政府和各行業提供一攬子智能問答解決方案的團隊,目前已經落地的包括基于文本的智能客服機器人和基于語音的電話機器人等。
在大多數人的認知里,智能問答很可能是以上的3個印象,2011年打敗了人類取得問答競賽冠軍的waston;2017年被沙特授予公民身份的機器人sofia;更為大家熟知的鋼鐵俠中的機器人管家jarvis。在大家心目中,智能就意味著能夠像真人一樣交流。然而作為從業者,很遺憾地告訴大家,目前的技術還遠沒有達到這個目標,我認為本質上目前的智能問答技術是對信息檢索技術的一次升級,是量變而未到質變。這個皇冠上的明珠還等待我們去摘取。
既然問答技術還不成熟,那為什么還要投身到這個領域呢。我想從To B和To C兩個角度去回答。對企業來講,當前的問答技術雖然無法解答復雜的咨詢,但是大部分的簡單的頭部問題是可以比較好的解答的。從本輪AI大潮NLP賽道的幾名種子選手都從智能客服這個方向切入就可以看出企業是確實存在對智能問答的剛性需求。而對普通用戶來講,一方面siri等語音助手每天都在為用戶提供便捷的交互界面,另一方面像amazon echo這一類的智能家居產品也逐步進入千家萬戶,成為物聯網生態的中心入口之一,這便是智能問答的價值所在。
那如何實現智能問答機器人呢?我們先來看最基本的單輪問答機器人的實現原理。
熟悉搜索引擎的朋友會發現這個架構跟搜索引擎的很類似。單輪問答一般來說就是FAQ問答,是基于業務問答對組成的問答庫進行檢索匹配。其中FAQ問題集包含多個相似問法供用戶問題去匹配。預處理階段一般會進行文本糾錯,標準化和底層NLP特征提取;召回階段會在倒排索引中召回若干個候選問題(粗排),而最后的匹配階段會基于各種模型進行匹配打分并返回得分最高的結果(精排)。匹配階段還會引入其他模塊,如知識圖譜和拒識模型,目的是輔助提升匹配的最終準確率。
retrieval中的匹配可以看做是naive solution,詞袋+VSM, 篩選候選夠用了,但是精排需要更精致的策略,第一,要利用監督信息做擬合,我們構建基于問題對的訓練語料,擬合是否匹配這個二分類目標。第二,特征上拋棄稀疏的詞袋模型,而是構造各種相似度來做base scorer,然后利用非線性的抗噪能力強的xgboost來做融合,比如我們用到詞bigram, 字bigram, 核心詞,名詞等特征集合的相似度。這種方法的優缺點是一體的,由于模型只學習字面相似的特征,因此不受領域影響,通用性強,適合用在冷啟動階段;但也因為只考慮字面相似,無法處理更深層的語義匹配。
那如何度量語義的相似呢。詞向量技術的興起是語義匹配的前提,所謂詞向量,是將孤立的傳統的token表示映射到相互關聯的向量空間中,這種關聯性,或者說是相似性,是通過詞語的上下文的來描述的。也就是說,上下文越相似的詞語,他們的語義就越相似,詞向量的歐式距離就越近。這是很容易理解的,更妙的是,通過對向量進行簡單加減運算,能夠呈現出概念的關系,比如king-man+woman的結果非常接近于queen, 因此說明詞向量能夠一定程度刻畫語義。那對句子如何做向量表示呢?一個簡單的想法是直接求和平均,WMD是另一個比較有意思且有效的做法,他將計算句子到句子的相似度建模成一個運輸的問題,把句子p的各個詞,運輸到q的各個詞上,也可以說是變換;運輸成本是詞向量的cosine相似度,而要運輸的是各個詞在句子中的權重,用線性規劃求解一個最優解,即為p到q的距離。另外還有個有效的方法是SIF,思路是做詞向量加權求和,但是突顯出句子中非通用的部分,即權重用詞頻倒數來計算權重,實驗效果也很不錯。
上面的方法有一個問題就是沒有利用有監督信息,所以效果有明顯的天花板。下面介紹這個工作是基于深層網絡做有監督學習的匹配的,做法也比較簡單,首先把句子文本用one-hot編碼,假如詞典大小是500K,那編碼完長度就是500K維,其實等于是詞袋模型,然后輸入到一個多層的神經網絡去學習,最終得到一個128維的向量作為句子的語義表示,然后用cosine計算兩個句子與文檔的相似度作為模型輸出。這個方法其實是將高維稀疏的token特征映射到低維語義空間,跟詞向量的思路很類似,只不過訓練目標不同,并且這里使用了深層網絡結構。
但是CNN對上下文的處理能力依賴于窗口大小,遠距離就沒辦法處理了,因此要考慮另一種網絡單元RNN,這種單元是專門為時序模型量身打造的,簡單來說,每一時刻t上的隱藏狀態,或者說第t個詞上的語義編碼,都由兩個輸入共同決定,即上一時刻的隱藏狀態和當前時刻的原始輸入,而為了解決遠距離傳遞導致的梯度消失和梯度爆炸等問題,RNN有一些變種結構來應對,比如 LSTM和GRU等。
CNN和RNN都是對原始輸入進行語義編碼的基本單元,編碼后的向量就可以接入多層感知機進行相似度計算,如果是直接計算cosine相似度,那就是dssm的升級版,而更常見的做法是把兩個句子的編碼向量拼接在一起,再經過一個多層感知機計算相似度,而這種方法統稱為表達式建模;
另一種方案考慮到兩個句子之間的交互信息對學習他們是否匹配顯然更為重要,這一類方案被稱為交互式建模,右邊是一個典型的例子,他最大的不同是首先對兩個句子的所有窗口組合進行拼接和卷積,得到交互信息。然后再進行多次卷積和池化得到表示。其他的交互方式還包括編碼之后,進行交互操作,如作差,點乘等,還有計算attention表示,也是常見的交互方式。
下面介紹我們的方案,跟上面介紹的模型相比,我們的方案主要做了兩處改動,一個是使用了稠密連接的網絡結構,讓rnn層的輸入和輸出拼接在一起做為下一層的輸入,第二個是混合注意力機制,即在計算attention向量進行交互式建模的基礎上,增加self-attention向量計算,然后把兩個attention向量經過門機制進行融合,這樣做一方面引入了問句間的交互信息,同時又增強了對自身的表達建模。
上面的模型是比較復雜的模型,參數量有5.8M。在實際中應用中訓練語料會嚴重不足,為了解決這個問題,我們引入了遷移學習的策略。首先第一種是多任務聯合學習,比如在擬合兩個問句是否匹配的同時,也對問句進行分類預測;另外還可以同時對匹配的問題對做seq2seq的翻譯模型訓練。這兩個策略都證明能有效提升準確率。
而另一個思路更加直觀,即引入其他領域的語料,所謂多語料遷移。Fine-tune即參數微調是其中一種做法,即先用通用語料訓練網絡,固定底層表達層的參數,然后再使用領域語料調整上層參數;另一種思路參考了對抗學習的思想,即引入一個新的任務“混淆分類器”去判別當前樣本是來自源語料還是目標語料,通過在損失函數中增加反向的混淆分類損失項,讓混淆分類器盡可能地無法區分樣本的來源,從而保證共享了參數的表達網絡能夠學習到兩部分語料中共性的部分。
以上的介紹都是為了完成一個基本的單輪對話機器人,而實際應用中,往往存在需要需要交互的場景,比如查詢社保余額,就需要用戶提供指定信息,如姓名,身份證號,手機號等。這種是所謂任務導向型機器人,而另一種,基于知識圖譜的機器人也往往會涉及到多輪交互。這里簡單介紹一下多輪對話機器人的架構,整體上是一個對話管理系統,總的來說是管理會話狀態,包含4個模塊,分別是輸入部分:自然語言理解模塊NLU,負責意圖識別和抽取槽位實體,比如這里匹配到了意圖是查詢社保余額,抽取到了社保號1234。得到的意圖和槽位值會送入到對話狀態追蹤模塊,DST,他負責會話狀態的更新,形式化來說是一個函數,輸入是當前狀態s和當前的query經過NLU處理過得到的意圖和槽位值q, 輸出新的狀態s‘,下一步是把s’送入DPL,對話策略模塊,這個模塊是根據新的狀態s‘輸出行動a,通常這個決策選擇會依賴于一個外部數據庫或知識圖譜,最后,由輸出部分,自然語言生成模塊NLG負責將行動轉換為自然語言文本,返回給用戶。
前面提到的單輪FAQ機器人,有一個問題是問答準確率依賴于問答庫的質量,而問答庫的構建耗時費力,所以針對數據較大的非結構化文檔,如果可以直接從中抽取答案,是非常理想的做法。比如斯坦佛大學開源的drQA,就是基于wikipedia的語料做的一個開放域上的問答機器人,我們來看看這種閱讀理解機器人的架構示意,他也是基于檢索重排的思路,首先把可能的文段從語料庫中摘取出來,然后送入閱讀理解模型進行答案定位,打分,排序和選擇得分最高的答案。閱讀理解模型與匹配模型是類似的,需要先對問題和候選文段進行編碼表示,不同之處在于最終預測的目標是答案的起始和結束位置。我所在的團隊在去年,在閱讀理解的權威公開測評Squad v1中取得過第一的成績,同時參加這個測評的包括了google, facebook, 微軟,阿里idst, 科大訊飛等國內外同行。說明業界對這種技術還是非常看重的。
下面分享小知在把以上技術落地產品化的經驗。首先我們來看看小知的整體架構圖,核心引擎有兩部分,一塊是上面重點闡述的深度語義匹配模型,另一塊是本次分享沒有展開的知識圖譜引擎,在此之上,我們構建了FAQ機器人,多輪會話機器人(任務機器人),閑聊機器人等。以下是我們單輪和多輪機器人的示例。
在我們實際的落地項目中,得益于深度遷移模型的語義匹配能力和行業知識圖譜的的精準匹配和輔助追問,小知機器人能夠做到95%左右的問答準確率,并且節省了50%以上的服務人力,切實為政府和企業提升效率和降低成本。
在智能客服的基礎上,我們又打造了基于語音的電話機器人,力主融合智能客服,人工在線客服,工單系統和電話機器人,為客戶打造從售前售中售后的整體解決方案。
以下是電話機器人的整體架構圖,核心是自然語言理解NLU模塊,負責識別用戶提問意圖
提取相關實體。根據NLU輸出的結果,內置的對話管理引擎會進行流程狀態流轉和跟蹤。
另外,ASR語音識別和TTS語音合成是不可或缺的重要服務,這三個模塊相互協作,共同完成與用戶的交互。
最后對智能問答的未來發展提幾點我的看法。目前學術界比較公認的一個方向是,需要更有機地結合模型和規則,而在問答領域,規則的一大組成部分就是知識圖譜,包括開放領域的知識圖譜和專業領域知識圖譜。而更進一步地,我們需要研究帶有推理性質的事理型知識圖譜去描述領域內的規則和知識,讓機器人能夠處理帶有復雜條件的問題,提供更智能的回復。在我看來,智能問答的一個突破口就在于解決以上三個問題。以上就是今天分享的內容,謝謝大家。
主講人介紹:
陳松堅,騰訊數據平臺部算法高級研究員,有著8 年的 NLP 研發經驗,2017 年加入騰訊 TEG 數據平臺部,負責智能客服產品騰訊小知的算法規劃和落地。負責過多個智能客服項目,對封閉領域的智能問答有豐富的實戰經驗。
電話機器人是什么?
電話機器人主要就是用來模擬人工通話的一組程序電話機器人架構組成,一般由電話機器人架構組成,CRM系統,語義識別,轉換文字,話術體系,這是軟的部分,再加上底層軟交換和通信模塊一起,合并起來就是一套完整的電話機器人系統。
電話機器人架構組成的介紹就聊到這里吧,感謝你花時間閱讀本站內容,更多關于電話機器人是什么、電話機器人架構組成的信息別忘了在本站進行查找喔。