婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 詳解用python實現爬取CSDN熱門評論URL并存入redis

詳解用python實現爬取CSDN熱門評論URL并存入redis

熱門標簽:原裝電話機器人 平頂山外呼系統免費 江蘇客服外呼系統廠家 清遠360地圖標注方法 400電話申請服務商選什么 西藏智能外呼系統五星服務 工廠智能電話機器人 在哪里辦理400電話號碼 千陽自動外呼系統

一、配置webdriver

下載谷歌瀏覽器驅動,并配置好

import time
import random
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
if __name__ == '__main__':
  options = webdriver.ChromeOptions()
  options.binary_location = r'C:\Users\hhh\AppData\Local\Google\Chrome\Application\谷歌瀏覽器.exe'
  # driver=webdriver.Chrome(executable_path=r'D:\360Chrome\chromedriver\chromedriver.exe')
  driver = webdriver.Chrome(options=options)
  #以java模塊為例
  driver.get('https://www.csdn.net/nav/java')
  for i in range(1,20):
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight)")
    time.sleep(2)

二、獲取URL

from bs4 import BeautifulSoup
from lxml import etree 
html = etree.HTML(driver.page_source)
# soup = BeautifulSoup(html, 'lxml')
# soup_herf=soup.find_all("#feedlist_id > li:nth-child(1) > div > div > h2 > a")
# soup_herf
title = html.xpath('//*[@id="feedlist_id"]/li/div/div/h2/a/@href')

可以看到,一下爬取了很多,速度非常快

三、寫入Redis

導入redis包后,配置redis端口和redis數據庫,用rpush函數寫入
打開redis

import redis
r_link = redis.Redis(port='6379', host='localhost', decode_responses=True, db=1)
for u in title:
    print("準備寫入{}".format(u))
    r_link.rpush("csdn_url", u)
    print("{}寫入成功!".format(u))
print('=' * 30, '\n', "共計寫入url:{}個".format(len(title)), '\n', '=' * 30)

大功告成!

在Redis Desktop Manager中可以看到,爬取和寫入都是非常的快。


要使用只需用rpop出棧就OK

one_url = r_link.rpop("csdn_url)")
while one_url:
  print("{}被彈出!".format(one_url))

到此這篇關于詳解用python實現爬取CSDN熱門評論URL并存入redis的文章就介紹到這了,更多相關python爬取URL內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python 爬取京東指定商品評論并進行情感分析
  • python爬取晉江文學城小說評論(情緒分析)
  • 利用Python網絡爬蟲爬取各大音樂評論的代碼
  • python 利用百度API進行淘寶評論關鍵詞提取
  • python 爬取騰訊視頻評論的實現步驟
  • python爬取微博評論的實例講解
  • python實現模擬器爬取抖音評論數據的示例代碼
  • 如何基于Python爬取隱秘的角落評論
  • Python實現爬取并分析電商評論
  • python 爬取馬蜂窩景點翻頁文字評論的實現
  • 用Python爬取QQ音樂評論并制成詞云圖的實例
  • python 爬取華為應用市場評論

標簽:日照 隨州 錦州 白城 股票 天水 西安 安慶

巨人網絡通訊聲明:本文標題《詳解用python實現爬取CSDN熱門評論URL并存入redis》,本文關鍵詞  詳解,用,python,實現,爬取,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《詳解用python實現爬取CSDN熱門評論URL并存入redis》相關的同類信息!
  • 本頁收集關于詳解用python實現爬取CSDN熱門評論URL并存入redis的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 山阳县| 奉化市| 房山区| 龙游县| 察雅县| 通城县| 金华市| 阿克苏市| 六枝特区| 南溪县| 论坛| 青浦区| 光山县| 开远市| 义马市| 辽宁省| 新丰县| 明星| 寿宁县| 景泰县| 民勤县| 龙川县| 郴州市| 屯门区| 杭锦旗| 紫阳县| 隆德县| 乌海市| 保康县| 玉屏| 繁昌县| 乌海市| 南雄市| 普兰县| 桐柏县| 许昌市| 微博| 平原县| 平阳县| 深泽县| 五峰|