中,傳統(tǒng)式電話營銷占企業(yè)總營業(yè)額的一大半一部分,電話營銷客戶服務(wù)中心每日呼出幾萬元打電話,銷售話術(shù)全是如影隨行。但傳統(tǒng)式的電銷在線客服存有流通性大,塑造時間長,人工成本高的缺陷,怎樣降低企業(yè)的成本費又不降低電話營銷的市場份額,是每所遭遇的難點。智能化電銷機器人的發(fā)生,讓以上傳統(tǒng)式市場銷售難點引刃而解。但是,因為智能化電銷機器人未對于金融業(yè)情景開展改進(jìn)和難以解決的語義識別等緣故,還未能運用于金融行業(yè)。
文中指出了一種組成應(yīng)用文本相似度測算與特征詞標(biāo)準(zhǔn)配對的方式,可以提升語義識別準(zhǔn)確度,完成更加友善的人機對戰(zhàn)對話。
傳統(tǒng)式的語義識別要靠軟件開發(fā)工作人員寫一些標(biāo)準(zhǔn)來處理語義識別問題。可是,要窮舉并制訂這種標(biāo)準(zhǔn)針對開發(fā)者而言勞動量無法想象。由于在自然語言處理行業(yè)中始終有寫不完的標(biāo)準(zhǔn),這時就必須智能機器人應(yīng)用你的自學(xué)能力開展邏輯推理。TF-IDF詞袋模型能依據(jù)詞的關(guān)鍵水平加上相匹配權(quán)重值,更合乎對話詞義邏輯性,但會使原文件格式轉(zhuǎn)換為高維的稀少空間向量,為向量儲存和相似之處測算產(chǎn)生了非常大的艱難。其關(guān)鍵技術(shù)性包括如下所示:
1、對電銷對話語料數(shù)據(jù)信息開展清理,刪掉對話邏輯性不科學(xué)的數(shù)據(jù)信息,刪掉語音轉(zhuǎn)文本全過程中鑒別偏差過大的數(shù)據(jù)信息,保存一部分語音轉(zhuǎn)文本全過程中的錯別字,進(jìn)而提升實體模型的抗干擾性。
2、應(yīng)用python分詞工具jieba包對清理后的語料開展中文分詞,與此同時刪掉停用詞和低頻詞。
3、創(chuàng)建詞袋模型,根據(jù)TF-IDF優(yōu)化算法測算各詞的關(guān)鍵水平并做權(quán)重計算解決。
4、應(yīng)用LSI對TF-IDF詞袋模型開展特征提取,去除小的奇異值,將文本文檔特點室內(nèi)空間變成文本文檔定義室內(nèi)空間。
5、整理電銷整體步驟,獲取電銷步驟中的每個情景,對于不一樣情景設(shè)定多種多樣意圖紙句。
6、將顧客的即時對話數(shù)據(jù)信息與各種各樣句核對(定義空間向量之問應(yīng)用內(nèi)積的交角余弦相似度測算比原先根據(jù)全文本空間向量的相似之處測算更靠譜),超過設(shè)定的相似之處閥值即鑒別為該情景下的相匹配用意。
7、開展電銷的相匹配銷售話術(shù),進(jìn)行一輪人機對戰(zhàn)對話。
對語音轉(zhuǎn)文本數(shù)據(jù)處理方法步驟如下所示:
比如,客戶說:“我還在駕車,到時候說。”標(biāo)準(zhǔn)配對字典中僅有“繁忙”“有急事”等,無 ** 確判斷顧客是“忙”的情景。將顧客的對話與意圖紙句開展同源性核對,若超過預(yù)置閥值則可判斷為“忙”的情況。
文本相似度測算應(yīng)用無輔導(dǎo)優(yōu)化算法,不用很多人力資源標(biāo)明,與此同時加上新語料時,可自動更新特點引流矩陣,無需再次練習(xí),合適商品快速迭代發(fā)布;組成應(yīng)用文本相似度計算方式與特征詞標(biāo)準(zhǔn)配對方式,在智能化電銷對話全過程里能更確切的掌握顧客意圖識別,并高效增強了語義識別準(zhǔn)確度。