婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲分析微博熱搜關鍵詞的實現代碼

Python爬蟲分析微博熱搜關鍵詞的實現代碼

熱門標簽:外呼系統前面有錄音播放嗎 400電話辦理費用收費 千呼ai電話機器人免費 柳州正規電銷機器人收費 申請辦個400電話號碼 鎮江人工外呼系統供應商 深圳網絡外呼系統代理商 騰訊地圖標注有什么版本 高德地圖標注字母

1,使用到的第三方庫
requests
BeautifulSoup 美味湯
worldcloud 詞云
jieba 中文分詞
matplotlib 繪圖
2,代碼實現部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#設置字體
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hottopnav=1wvr=6'

try:
  #獲取數據
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分詞
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) = 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #輸出詞云圖
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博熱搜關鍵詞詞云.png')
  key = list(set(redata))
  x,y = [],[]
  #篩選數據
  for st in key:
    count = redata.count(st)
    if count = 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #繪制結果圖
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

 

3,運行結果


到此這篇關于Python爬蟲分析微博熱搜關鍵詞的文章就介紹到這了,更多相關Python爬蟲微博熱搜內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python一些性能分析的技巧
  • Python性能分析工具py-spy原理用法解析
  • Python內置類型性能分析過程實例
  • Python性能分析工具Profile使用實例
  • cProfile Python性能分析工具使用詳解
  • Python中判斷子串存在的性能比較及分析總結
  • 使用pycallgraph分析python代碼函數調用流程以及框架解析
  • 使用bandit對目標python代碼進行安全函數掃描的案例分析
  • python中delattr刪除對象方法的代碼分析
  • python3中確保枚舉值代碼分析
  • python如何做代碼性能分析

標簽:烏蘭察布 哈爾濱 合肥 海南 平頂山 烏蘭察布 郴州 大慶

巨人網絡通訊聲明:本文標題《Python爬蟲分析微博熱搜關鍵詞的實現代碼》,本文關鍵詞  Python,爬蟲,分析,微博,熱搜,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲分析微博熱搜關鍵詞的實現代碼》相關的同類信息!
  • 本頁收集關于Python爬蟲分析微博熱搜關鍵詞的實現代碼的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 云林县| 庆安县| 蒲江县| 慈溪市| 赫章县| 县级市| 中方县| 清镇市| 民和| 长兴县| 阿坝| 达孜县| 婺源县| 阳高县| 桃园市| 济阳县| 鹿邑县| 和顺县| 佛冈县| 乾安县| 开封市| 蚌埠市| 印江| 米脂县| 九寨沟县| 巴塘县| 石渠县| 滁州市| 广宗县| 永善县| 荥阳市| 西畴县| 互助| 朝阳市| 武乡县| 湖州市| 泗洪县| 岐山县| 静宁县| 乌海市| 江孜县|