婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python統(tǒng)計詞頻并繪制圖片(附完整代碼)

Python統(tǒng)計詞頻并繪制圖片(附完整代碼)

熱門標簽:ai電話機器人哪里好 ai電銷機器人源碼 長沙高頻外呼系統(tǒng)原理是什么 百度地圖標注沒有了 外呼并發(fā)線路 地圖標注審核表 西藏房產(chǎn)智能外呼系統(tǒng)要多少錢 湛江智能外呼系統(tǒng)廠家 宿遷星美防封電銷卡

效果



1 實現(xiàn)代碼

讀取txt文件:

def readText(text_file_path):
    with open(text_file_path, encoding='gbk') as f: #
        content = f.read()
    return content

得到文章的詞頻:

def getRecommondArticleKeyword(text_content,  key_word_need_num = 10, custom_words = [], stop_words =[], query_pattern = 'searchEngine'):
    '''
    :param text_content: 文本字符串
    :param key_word_need_num: 需要的關(guān)鍵詞數(shù)量
    :param custom_words: 自定義關(guān)鍵詞
    :param stop_words: 不查詢關(guān)鍵詞
    :param query_pattern:
    precision:精確模式————試圖將句子最精確地切開,適合文本分析;
    entire:全模式————把句子中所有的可以成詞的詞語都掃描出來, 速度非常快,但是不能解決歧義;
    searchEngine:搜索引擎模式————在精確模式的基礎(chǔ)上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞;
    paddle模式————利用PaddlePaddle深度學習框架,訓練序列標注(雙向GRU)網(wǎng)絡(luò)模型實現(xiàn)分詞。同時支持詞性標注。
    :return:
    '''
    # jieba.enable_paddle()
    # paddle.fluid.install_check.run_check()
    if not isinstance(text_content, str):
        raise ValueError('文本字符串類型錯誤!')
    if not isinstance(key_word_need_num, int):
        raise ValueError('關(guān)鍵詞個數(shù)類型錯誤!')
    if not isinstance(custom_words, list):
        raise ValueError('自定義關(guān)鍵詞類型錯誤!')
    if not isinstance(stop_words, list):
        raise ValueError('屏蔽關(guān)鍵詞類型錯誤!')
    if not isinstance(query_pattern, str):
        raise ValueError('查詢模式類型錯誤!')

    # 添加自定義關(guān)鍵詞
    for word in custom_words:
        jieba.add_word(word)

    if query_pattern == 'searchEngine':
        key_words = jieba.cut_for_search(text_content)
    elif query_pattern == 'entire':
        key_words = jieba.cut(text_content, cut_all=True, use_paddle=True)
    elif query_pattern == 'precision':
        key_words = jieba.cut(text_content, cut_all=False, use_paddle=True)
    else:
        return []

    # print("拆分后的詞: %s" % " ".join(key_words))

    # 過濾后的關(guān)鍵詞
    stop_words = set(stop_words)
    word_count = Counter()
    for word in key_words:
        if len(word) > 1 and word not in stop_words:
            word_count[word] += 1

    # res_words = list()
    # for data in word_count.most_common(key_word_need_num):
    #     res_words.append(data[0])
    # return res_words

    return word_count

繪制圖片:

def drawWordsCloud(word_count, save_img_filePath='', img_mask_filePath=''):
    # print(word_count)
    # print(type(word_count))

    if len(img_mask_filePath) != 0:
        img_mask = np.array(Image.open(img_mask_filePath)) #打開遮罩圖片,將圖片轉(zhuǎn)換為數(shù)組
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 設(shè)置中文字體,詞云默認字體是“DroidSansMono.ttf字體庫”,不支持中文
                                 background_color="white",  # 設(shè)置背景顏色
                                 max_words=200,  # 設(shè)置最大顯示的字數(shù)
                                 max_font_size=50,  # 設(shè)置字體最大值
                                 random_state=30,  # 設(shè)置有多少種隨機生成狀態(tài),即有多少種配色方案
                                 width=400,
                                 height=200,
                                 mask=img_mask
                                 )
    else:
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 設(shè)置中文字體,詞云默認字體是“DroidSansMono.ttf字體庫”,不支持中文
                                 background_color="white",  # 設(shè)置背景顏色
                                 max_words=200,  # 設(shè)置最大顯示的字數(shù)
                                 max_font_size=50,  # 設(shè)置字體最大值
                                 random_state=30,  # 設(shè)置有多少種隨機生成狀態(tài),即有多少種配色方案
                                 width=400,
                                 height=200
                                 )
    # 繪圖
    wc.generate_from_frequencies(word_count)   #從字典生成詞云
    plt.imshow(wc)      #顯示詞云
    plt.axis('off')     #關(guān)閉坐標軸
    plt.show()          #顯示圖像

    # 保存圖片
    if len(save_img_filePath) != 0:
        wc.to_file(save_img_filePath)
    else:
        pass

2 完整代碼

#-*- coding : utf-8-*-
import jieba
from collections import Counter
import paddle

import wordcloud    #詞云展示庫
import matplotlib.pyplot as plt     #圖像展示庫

import time

from PIL import Image
import numpy as np

def timer(func):
    def calculateTime(*args, **kwargs):
        t = time.perf_counter()
        result = func(*args, **kwargs)
        print(f'func {func.__name__} coast time:{time.perf_counter() - t:.8f} s')
        return result
    return calculateTime

def readText(text_file_path):
    with open(text_file_path, encoding='gbk') as f: #
        content = f.read()
    return content

@timer
def getRecommondArticleKeyword(text_content,  key_word_need_num = 10, custom_words = [], stop_words =[], query_pattern = 'searchEngine'):
    '''
    :param text_content: 文本字符串
    :param key_word_need_num: 需要的關(guān)鍵詞數(shù)量
    :param custom_words: 自定義關(guān)鍵詞
    :param stop_words: 不查詢關(guān)鍵詞
    :param query_pattern:
    precision:精確模式————試圖將句子最精確地切開,適合文本分析;
    entire:全模式————把句子中所有的可以成詞的詞語都掃描出來, 速度非常快,但是不能解決歧義;
    searchEngine:搜索引擎模式————在精確模式的基礎(chǔ)上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞;
    paddle模式————利用PaddlePaddle深度學習框架,訓練序列標注(雙向GRU)網(wǎng)絡(luò)模型實現(xiàn)分詞。同時支持詞性標注。
    :return:
    '''
    # jieba.enable_paddle()
    # paddle.fluid.install_check.run_check()
    if not isinstance(text_content, str):
        raise ValueError('文本字符串類型錯誤!')
    if not isinstance(key_word_need_num, int):
        raise ValueError('關(guān)鍵詞個數(shù)類型錯誤!')
    if not isinstance(custom_words, list):
        raise ValueError('自定義關(guān)鍵詞類型錯誤!')
    if not isinstance(stop_words, list):
        raise ValueError('屏蔽關(guān)鍵詞類型錯誤!')
    if not isinstance(query_pattern, str):
        raise ValueError('查詢模式類型錯誤!')

    # 添加自定義關(guān)鍵詞
    for word in custom_words:
        jieba.add_word(word)

    if query_pattern == 'searchEngine':
        key_words = jieba.cut_for_search(text_content)
    elif query_pattern == 'entire':
        key_words = jieba.cut(text_content, cut_all=True, use_paddle=True)
    elif query_pattern == 'precision':
        key_words = jieba.cut(text_content, cut_all=False, use_paddle=True)
    else:
        return []

    # print("拆分后的詞: %s" % " ".join(key_words))

    # 過濾后的關(guān)鍵詞
    stop_words = set(stop_words)
    word_count = Counter()
    for word in key_words:
        if len(word) > 1 and word not in stop_words:
            word_count[word] += 1

    # res_words = list()
    # for data in word_count.most_common(key_word_need_num):
    #     res_words.append(data[0])
    # return res_words

    return word_count

def drawWordsCloud(word_count, save_img_filePath='', img_mask_filePath=''):
    # print(word_count)
    # print(type(word_count))

    if len(img_mask_filePath) != 0:
        img_mask = np.array(Image.open(img_mask_filePath)) #打開遮罩圖片,將圖片轉(zhuǎn)換為數(shù)組
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 設(shè)置中文字體,詞云默認字體是“DroidSansMono.ttf字體庫”,不支持中文
                                 background_color="white",  # 設(shè)置背景顏色
                                 max_words=200,  # 設(shè)置最大顯示的字數(shù)
                                 max_font_size=50,  # 設(shè)置字體最大值
                                 random_state=30,  # 設(shè)置有多少種隨機生成狀態(tài),即有多少種配色方案
                                 width=400,
                                 height=200,
                                 mask=img_mask
                                 )
    else:
        wc = wordcloud.WordCloud(font_path='/Library/Fonts/Arial Unicode.ttf',# 設(shè)置中文字體,詞云默認字體是“DroidSansMono.ttf字體庫”,不支持中文
                                 background_color="white",  # 設(shè)置背景顏色
                                 max_words=200,  # 設(shè)置最大顯示的字數(shù)
                                 max_font_size=50,  # 設(shè)置字體最大值
                                 random_state=30,  # 設(shè)置有多少種隨機生成狀態(tài),即有多少種配色方案
                                 width=400,
                                 height=200
                                 )
    # 繪圖
    wc.generate_from_frequencies(word_count)   #從字典生成詞云
    plt.imshow(wc)      #顯示詞云
    plt.axis('off')     #關(guān)閉坐標軸
    plt.show()          #顯示圖像

    # 保存圖片
    if len(save_img_filePath) != 0:
        wc.to_file(save_img_filePath)
    else:
        pass



if __name__ == '__main__':
    pass
    # /Users/mac/Downloads/work/retailSoftware/公司項目/test.txt
    text_file_path = "/Users/mac/Downloads/電子書/編程思想/相約星期二/相約星期二.txt"
    # text_file_path = "/Users/mac/Downloads/work/retailSoftware/公司項目/test3.txt"
    text_content = readText(text_file_path)
    # print(text_content)
    # print(JNI_API_getRecommondArticleKeyword(text_content))
    img_mask_filePath = '/Users/mac/Desktop/截屏2021-08-20 下午4.02.10.png'
    img_save_filePath = '/Users/mac/Downloads/test9.png'
    drawWordsCloud(getRecommondArticleKeyword(text_content), img_save_filePath, img_mask_filePath)


到此這篇關(guān)于Python統(tǒng)計詞頻并繪制圖片(附完整代碼)的文章就介紹到這了,更多相關(guān)Python統(tǒng)計詞頻繪制圖片內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python中Matplotlib繪制直線的實例代碼
  • python一繪制元二次方程曲線的實例分析
  • python基于turtle繪制幾何圖形
  • 淺談Python pygame繪制機制
  • 利用Python快速繪制海報地圖

標簽:寧夏 林芝 南平 盤錦 漯河 海南 大同 普洱

巨人網(wǎng)絡(luò)通訊聲明:本文標題《Python統(tǒng)計詞頻并繪制圖片(附完整代碼)》,本文關(guān)鍵詞  Python,統(tǒng)計,詞頻,并,繪制,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python統(tǒng)計詞頻并繪制圖片(附完整代碼)》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python統(tǒng)計詞頻并繪制圖片(附完整代碼)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    亚洲欧美日韩成人高清在线一区| 色域天天综合网| 偷窥少妇高潮呻吟av久久免费| 自拍偷拍欧美激情| 一区二区三区在线视频免费 | 亚洲另类春色国产| 亚洲视频一区二区在线| 亚洲欧美一区二区三区极速播放 | 国产精品电影一区二区三区| 国产欧美一区二区三区鸳鸯浴| 国产欧美一区二区精品忘忧草| 欧美激情一区不卡| 亚洲已满18点击进入久久| 亚洲v中文字幕| 捆绑变态av一区二区三区| 国产老肥熟一区二区三区| 国产成人精品亚洲日本在线桃色| 成人中文字幕合集| 欧美亚洲自拍偷拍| 欧美一区午夜精品| 国产精品久久久久影院亚瑟| 伊人色综合久久天天人手人婷| 天天综合网 天天综合色| 国产一区二区三区av电影| av一区二区不卡| 欧美日韩精品一区视频| 久久久.com| 日韩极品在线观看| 成人黄色国产精品网站大全在线免费观看 | 99re这里只有精品首页| 欧美日韩国产美| 国产精品麻豆网站| 天天综合色天天| 99精品视频免费在线观看| 91精品国产高清一区二区三区蜜臀| 国产喷白浆一区二区三区| 婷婷成人激情在线网| heyzo一本久久综合| 欧美一级片免费看| √…a在线天堂一区| 免费看日韩精品| 在线精品视频一区二区| 国产视频在线观看一区二区三区| 亚洲高清免费在线| 94-欧美-setu| 久久久精品欧美丰满| 五月天激情综合| 91香蕉视频在线| 欧美国产精品中文字幕| 九九九久久久精品| 在线播放/欧美激情| 尤物av一区二区| voyeur盗摄精品| 国产精品美日韩| 国产精品888| 欧美精品一区二区久久婷婷| 亚洲va天堂va国产va久| 91蝌蚪国产九色| 亚洲婷婷国产精品电影人久久| 国产精品资源站在线| 欧美电影免费提供在线观看| 天天av天天翘天天综合网| 欧美自拍偷拍午夜视频| 亚洲人被黑人高潮完整版| 99re66热这里只有精品3直播| 欧美国产日产图区| 成人av在线一区二区| 国产精品久久久久久一区二区三区| 精品影院一区二区久久久| 26uuu国产一区二区三区| 韩国欧美国产一区| 日韩精品自拍偷拍| 国产一区二区伦理| 国产婷婷色一区二区三区四区 | 一本大道久久a久久精二百| 中文字幕亚洲一区二区va在线| 成人精品视频一区| 亚洲欧美日韩一区二区三区在线观看 | 国产亚洲一二三区| 成人国产在线观看| 亚洲精品五月天| 在线免费精品视频| 亚洲高清免费在线| 日韩三级.com| 国产成人在线视频免费播放| 国产日产欧美一区二区三区| 成人av电影在线网| 亚洲高清久久久| 欧美成人在线直播| 不卡的看片网站| 午夜影视日本亚洲欧洲精品| 日韩一级免费观看| 国产69精品久久久久毛片| 亚洲精品免费在线观看| 欧美一区二区三区四区高清| 精品在线观看视频| 亚洲卡通欧美制服中文| 日韩一区二区在线免费观看| 国产在线视频精品一区| 亚洲欧美国产高清| 欧美成人性福生活免费看| www.亚洲精品| 麻豆成人av在线| 亚洲精品高清在线观看| 欧美不卡一区二区| 色综合色狠狠天天综合色| 久久99国内精品| 一区二区三区资源| 国产欧美日韩在线视频| 欧美视频在线不卡| av激情综合网| 精品在线观看视频| 亚洲va天堂va国产va久| 国产日产欧美精品一区二区三区| 欧美日韩成人一区二区| 国产69精品久久777的优势| 午夜影院久久久| 亚洲特级片在线| 国产三级精品视频| 日韩欧美一区在线观看| 欧美色视频一区| 99久久国产综合精品女不卡| 精品亚洲aⅴ乱码一区二区三区| 亚洲在线视频免费观看| 国产精品久久久久婷婷二区次| 日韩一区二区电影在线| 欧美色手机在线观看| 99re热这里只有精品视频| 国产91精品久久久久久久网曝门| 日韩激情视频网站| 亚洲一二三四在线| 亚洲精品少妇30p| 成人欧美一区二区三区1314| 久久精品夜色噜噜亚洲aⅴ| 日韩欧美电影一区| 91精品国产综合久久蜜臀| 欧美三级日本三级少妇99| 色婷婷精品久久二区二区蜜臂av| 成人激情小说乱人伦| 国产成人8x视频一区二区| 国产一区二区不卡| 国产精品原创巨作av| 国产麻豆精品95视频| 国产精品香蕉一区二区三区| 国产一区二区三区香蕉| 九色porny丨国产精品| 精品一二三四在线| 国产乱码精品一品二品| 国产成人综合在线| 成人黄色国产精品网站大全在线免费观看| 国产一区91精品张津瑜| 国产a级毛片一区| eeuss国产一区二区三区| 91蜜桃网址入口| 在线观看网站黄不卡| 欧美日本一道本| 26uuu亚洲| 中文字幕一区视频| 一个色综合网站| 日本vs亚洲vs韩国一区三区 | 成人一级片在线观看| 成人免费视频一区| 91原创在线视频| 欧美精品第1页| 国产校园另类小说区| 亚洲欧美日韩国产综合在线| 亚洲一区二区欧美日韩| 天堂久久久久va久久久久| 久久国产综合精品| caoporn国产精品| 欧美日韩一区二区三区高清| 欧美tickling挠脚心丨vk| 中文字幕一区视频| 首页亚洲欧美制服丝腿| 国产成人免费9x9x人网站视频| 色综合久久久久综合99| 欧美一三区三区四区免费在线看 | 一区二区三区四区蜜桃| 日韩有码一区二区三区| 成人av资源站| 日韩午夜三级在线| 一区在线中文字幕| 蜜臀久久99精品久久久久宅男| av网站一区二区三区| 欧美一区二区三区在| 亚洲图片激情小说| 精品一二三四在线| 欧美手机在线视频| 中文字幕一区二区三区精华液| 日本亚洲一区二区| 色综合久久久久综合体| 久久视频一区二区| 美腿丝袜亚洲三区| 欧美专区日韩专区| 久久精品日韩一区二区三区| 日日夜夜免费精品| 欧美视频一区二区在线观看| 中文字幕在线不卡一区| 国产精品一区专区| 日韩精品最新网址|