婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python中文糾錯的簡單實現

Python中文糾錯的簡單實現

熱門標簽:預覽式外呼系統 銀川電話機器人電話 電銷機器人錄音要學習什么 外賣地址有什么地圖標注 企業彩鈴地圖標注 上海正規的外呼系統最新報價 如何地圖標注公司 煙臺電話外呼營銷系統 長春極信防封電銷卡批發

介紹

這篇文章主要是用 Python 實現了簡單的中文分詞的同音字糾錯,目前的案例中只允許錯一個字,自己如果有興趣可以繼續優化下去。具體步驟如下所示:

  • 先準備一個文件,里面每一行中放一個中文分詞,我這里的文件是下面代碼中的 /Users/wys/Desktop/token.txt ,你們可以改成自己,再運行代碼
  • 將構建一個前綴樹類,實現插入功能,將所有的標準分詞都插入到前綴樹中,另外實現一個搜索功能,用來搜索分詞
  • 將輸入的錯誤分詞中的每個字都找出 10 個同音字,將每個字都用 10 個同音字替換,結果可以最多得到 n*10 個分詞,n 為分詞的長度,因為有的音可能沒有 10 個同音字。
  • 將這些分詞都經過前綴樹的查找,如果能搜到,將其作為正確糾正就過返回

代碼

import re,pinyin
from Pinyin2Hanzi import DefaultDagParams
from Pinyin2Hanzi import dag

class corrector():
    def __init__(self):
        self.re_compile = re.compile(r'[\u4e00-\u9fff]')
        self.DAG = DefaultDagParams()

    # 將文件中的詞讀取
    def getData(self):
        words = []
        with open("/Users/wys/Desktop/token.txt") as f:
            for line in f.readlines():
                word = line.split(" ")[0]
                if word and len(word) > 2:
                    res = self.re_compile.findall(word)
                    if len(res) == len(word): ## 保證都是漢字組成的分詞
                        words.append(word)
        return words

    # 將每個拼音轉換成同音的 10 個候選漢字,
    def pinyin_2_hanzi(self, pinyinList):
        result = []
        words = dag(self.DAG, pinyinList, path_num=10)
        for item in words:
            res = item.path  # 轉換結果
            result.append(res[0])
        return result

    # 獲得詞經過轉換的候選結結果
    def getCandidates(self, phrase):
        chars = {}
        for c in phrase:
            chars[c] = self.pinyin_2_hanzi(pinyin.get(c, format='strip', delimiter=',').split(','))
        replaces = []
        for c in phrase:
            for x in chars[c]:
                replaces.append(phrase.replace(c, x))
        return set(replaces)

    # 獲得糾錯之后的正確結果
    def getCorrection(self, words):
        result = []
        for word in words:
            for word in self.getCandidates(word):
                if Tree.search(word):
                    result.append(word)
                    break
        return result

class Node:
    def __init__(self):
        self.word = False
        self.child = {}


class Trie(object):
    def __init__(self):
        self.root = Node()

    def insert(self, words):
        for word in words:
            cur = self.root
            for w in word:
                if w not in cur.child:
                    cur.child[w] = Node()
                cur = cur.child[w]

            cur.word = True

    def search(self, word):
        cur = self.root
        for w in word:
            if w not in cur.child:
                return False
            cur = cur.child[w]

        if cur.word == False:
            return False
        return True

if __name__ == '__main__':
    # 初始化糾正器
    c = corrector()
    # 獲得單詞
    words = c.getData()
    # 初始化前綴樹
    Tree = Trie()
    # 將所有的單詞都插入到前綴樹中
    Tree.insert(words)
    # 測試
    print(c.getCorrection(['專塘街道','轉塘姐道','轉塘街到']))

結果

打印結果為:
['轉塘街道', '轉塘街道', '轉塘街道']

可以看出都糾正成功了,有一定的效果 ,之后會繼續優化。

到此這篇關于Python中文糾錯的簡單實現的文章就介紹到這了,更多相關Python中文糾錯內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python容錯的前綴樹實現中文糾錯

標簽:盤錦 珠海 西寧 湖北 上饒 宜昌 潮州 佳木斯

巨人網絡通訊聲明:本文標題《Python中文糾錯的簡單實現》,本文關鍵詞  Python,中文,糾,錯的,簡單,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python中文糾錯的簡單實現》相關的同類信息!
  • 本頁收集關于Python中文糾錯的簡單實現的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    亚洲一二三四久久| 精品精品国产高清一毛片一天堂| 五月婷婷久久丁香| 国产精品福利一区二区| 亚洲精品在线观| 欧美精品视频www在线观看| 精品一区精品二区高清| 天堂成人免费av电影一区| 亚洲另类中文字| 亚洲三级理论片| 精品粉嫩aⅴ一区二区三区四区 | 7777精品伊人久久久大香线蕉的| 99国产一区二区三精品乱码| 日韩黄色免费电影| 一区二区三区成人在线视频| 亚洲精品免费在线| 一色屋精品亚洲香蕉网站| 欧美激情艳妇裸体舞| 国产亚洲欧美日韩日本| 国产人久久人人人人爽| 久久久青草青青国产亚洲免观| 精品日韩欧美在线| 精品国产乱码91久久久久久网站| 日韩精品中文字幕一区二区三区 | 国产真实精品久久二三区| 婷婷国产在线综合| 久久成人18免费观看| 午夜私人影院久久久久| 日韩**一区毛片| 免费精品视频最新在线| 精品在线观看免费| 美女视频一区二区三区| 久久不见久久见免费视频7| 精品一二三四区| 成人一区二区三区中文字幕| 97精品国产露脸对白| 色婷婷综合久久久久中文 | 欧美色网站导航| 欧美日韩午夜影院| 欧美哺乳videos| 国产精品成人免费在线| 亚洲综合区在线| 精品一区二区免费在线观看| 久久福利资源站| 91在线porny国产在线看| 欧美日韩高清影院| 91.com在线观看| 中文字幕国产一区| 亚洲国产精品久久人人爱| 日本一区中文字幕| 国产成人啪免费观看软件 | 高清国产一区二区| 色婷婷国产精品综合在线观看| 99热国产精品| 欧美性猛交xxxx黑人交| 精品国产91九色蝌蚪| 亚洲精品视频在线| 亚洲成年人影院| hitomi一区二区三区精品| 欧美一区二区三区免费观看视频| 国产精品天天摸av网| 日韩电影在线观看电影| 成人午夜视频免费看| 欧美一卡在线观看| 亚洲国产一区二区三区| 国产福利视频一区二区三区| 69堂成人精品免费视频| 国产精品久久久久久亚洲毛片| 亚洲欧洲精品一区二区三区| 另类人妖一区二区av| 成人avav影音| 亚洲精品一区二区三区影院| 依依成人精品视频| 99久久er热在这里只有精品15 | 国产精品第一页第二页第三页| 三级在线观看一区二区| 色久优优欧美色久优优| 国产精品视频观看| 精品一区二区三区在线视频| 欧美电影在线免费观看| 美腿丝袜一区二区三区| 精品奇米国产一区二区三区| 国产在线乱码一区二区三区| 久久无码av三级| 成人白浆超碰人人人人| 中文字幕一区二区三区蜜月| 一本色道久久综合亚洲aⅴ蜜桃| 亚洲欧美国产毛片在线| 欧美视频在线不卡| 免费在线观看一区| 久久久不卡网国产精品二区| 成人禁用看黄a在线| 一区二区三区欧美日韩| 欧美一区二区三级| 成人听书哪个软件好| 亚洲欧美另类小说视频| 欧美丰满少妇xxxxx高潮对白| 久久99久久99| 亚洲三级在线免费观看| 欧美一区二区精品久久911| 国产精品一区在线| 亚洲午夜av在线| 精品少妇一区二区三区在线视频| 成a人片国产精品| 亚洲国产sm捆绑调教视频| 久久免费精品国产久精品久久久久| 成人av在线电影| 蜜臀av性久久久久蜜臀aⅴ流畅| 国产午夜精品一区二区三区嫩草| 99国产精品久| 久久精品久久99精品久久| 国产精品麻豆99久久久久久| 91麻豆精品国产91久久久 | 久久国产精品99精品国产| 中文字幕一区日韩精品欧美| 欧美剧情电影在线观看完整版免费励志电影| 极品少妇xxxx精品少妇| 夜夜揉揉日日人人青青一国产精品 | 亚洲人成在线播放网站岛国| 欧美一区二区三区在线观看视频| 国产99精品在线观看| 日韩中文字幕不卡| 亚洲麻豆国产自偷在线| 久久亚洲精品小早川怜子| 欧美三级资源在线| 91在线小视频| 成人免费视频视频在线观看免费 | 国产suv精品一区二区6| 美女视频黄久久| 亚洲va欧美va人人爽| 亚洲欧洲日韩女同| 国产欧美精品国产国产专区| 精品欧美乱码久久久久久1区2区| 欧美精品亚洲一区二区在线播放| 色婷婷综合在线| 96av麻豆蜜桃一区二区| 成人av电影在线网| 不卡的av电影| 成人视屏免费看| 国产1区2区3区精品美女| 久久精品99国产精品| 亚洲成人精品在线观看| 亚洲自拍与偷拍| 亚洲无人区一区| 五月天网站亚洲| 午夜在线成人av| 日一区二区三区| 日本在线播放一区二区三区| 日本不卡的三区四区五区| 日本怡春院一区二区| 久久99精品一区二区三区| 久久精品国产一区二区三| 精品一区二区三区免费播放| 国产美女视频一区| 成人黄色免费短视频| 91丨porny丨首页| 欧美三区免费完整视频在线观看| 精品视频在线免费看| 欧美一区二区三区视频在线观看| 日韩一区二区三区四区五区六区| 日韩一区二区视频在线观看| 精品乱人伦小说| 国产精品久久毛片a| 一个色综合av| 久久99久久久久久久久久久| 国产成人综合亚洲网站| 99久久久国产精品免费蜜臀| 欧美色图激情小说| www国产成人| 亚洲精品第一国产综合野| 日本不卡中文字幕| 国产suv一区二区三区88区| 在线观看免费一区| 欧美大黄免费观看| 亚洲视频免费看| 日本美女视频一区二区| 成人av网站在线观看免费| 欧美三级乱人伦电影| 久久久无码精品亚洲日韩按摩| 亚洲人成在线观看一区二区| 美日韩黄色大片| 91免费在线看| 久久男人中文字幕资源站| 亚洲精品视频观看| 国产一区二区精品久久91| 色诱视频网站一区| 337p粉嫩大胆噜噜噜噜噜91av| 一区二区在线观看免费视频播放| 美女网站在线免费欧美精品| 色哦色哦哦色天天综合| 久久婷婷综合激情| 亚洲不卡在线观看| 97精品久久久久中文字幕| 欧美成人激情免费网| 一区二区三区国产精华| 国产电影一区在线| 欧美一区二区私人影院日本| 亚洲精品写真福利| 国产福利视频一区二区三区| 日韩一级欧美一级|