婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > python 爬取騰訊視頻評論的實現步驟

python 爬取騰訊視頻評論的實現步驟

熱門標簽:申請辦個400電話號碼 400電話辦理費用收費 高德地圖標注字母 深圳網絡外呼系統(tǒng)代理商 騰訊地圖標注有什么版本 外呼系統(tǒng)前面有錄音播放嗎 千呼ai電話機器人免費 鎮(zhèn)江人工外呼系統(tǒng)供應商 柳州正規(guī)電銷機器人收費

一、網址分析

查閱了網上的大部分資料,大概都是通過抓包獲取。但是抓包有點麻煩,嘗試了F12,也可以獲取到評論。以電視劇《在一起》為例子。評論最底端有個查看更多評論猜測過去應該是 Ajax 的異步加載。
網上的大部分都是構建評論的網址,通過 requests 獲取,正則表達式進行數據處理。本文也利用該方法進行數據處理,其實利用 scrapy 會更簡單。
根據前輩給出的經驗,順利找到了評論所在的鏈接。

在新標簽中打開,該網址的鏈接。

評論都在"content":"xxxxx"里面,所有可以通過正則表達式獲取。
那么現在要開始構建網址,找到其規(guī)律。
在查找評論鏈接的過程中無意發(fā)現,點擊影評旁邊的評論總數,可以獲取到更為干凈的評論界面。結果是一樣的。

既然是要爬取所有的評論,所以知道評論數是必不可少的。

再通過F12獲取到評論鏈接,找到網址的規(guī)律,構建網址,加載三四個評論就行了。這里加載了四個網址。把所有網址復制到文本文件中,進行對比分析。

觀察發(fā)現只有 cursor 和 source 進行了改變,其他是不變的,二 source 是在第一個的基礎上進行加一操作,所以只需要獲取到 cursor 即可。我們打開一個評論鏈接的網址,我們可以知道,cursor 其實是上一頁 最后一個用戶的ID碼。所以我們只需要在爬取上一頁的時候一起爬蟲了。然后就可以構建網址。

二、代碼編寫

這個代碼還是簡單的。套用之前上課做的模板就可以直接進行爬蟲了。
通過正則表達式獲取評論,返回一個列表;
正則表達式獲得的 cursor 碼是列表,所以要轉化為字符串使用;
source 很簡單了,直接在上一個的基礎上加一即可。

def getComment(html): # 爬取單頁評論

 findeComment = re.compile(r'"content":"(.*?)"', re.S)
 comment = re.findall(findeComment, html)
 # print(comment)
 return comment

def getCursor(html): # 獲取下一頁的cursor碼
 findeCursor = re.compile(r'"last":"(.*?)"', re.S)
 cursor = re.findall(findeCursor, html)[0]
 # print(cursor)
 return cursor


def getSource(source): # 獲取下一頁的source碼
 source = int(source) + 1
 return str(source)

有點難度的可能就送弄代理吧,但是代理可以模仿網上其他人的寫法,所以還是不是很難。

#添加用戶代理

def ua(uapools):
 thisua = random.choice(uapools)
 # print(thisua)
 headers = ("User-Agent", thisua)
 opener = urllib.request.build_opener()
 opener.addheaders = [headers]
 # 設置為全局變量
 urllib.request.install_opener(opener)

三、遇到的問題

1. 獲取評論的時候也將子評論爬蟲進去了。

仔細查看了源碼,發(fā)現評論主要在 data 下面的 oriCommList 列表里,其他范圍的評論為子評論。個人認為子評論也算有效評論,目前不打算處理。

2. 獲取全部評論數,直接通過 requests 獲取不到

嘗試了 xpath 和 requests 發(fā)現不能獲取全部評論數,所以目前只能通過 selenium 獲取,但是 selenium 效率太低了,就獲取一個評論總數,還不如打開源碼直接修改評論總數,所以暫時沒有修改

3. 評論總數數據太大

因為之前爬蟲過很多網站,同一個 user-agent 很容易被 ban ,所以目前構建了用戶代理,然后進行隨機。其實還想加一個 ip 代理的,但是使用了 ip 代理的網址,上面寫的正常的 ip ,在使用的時候,拒絕連接。也嘗試過構建代理池。但是代理池一般都是使用docker 和 Redis 進行獲取。暫時沒有選用,之選用了用戶代理,然后在獲取 headers 的時候加個 time.sleep(1)。目前還是正常的。

4. 報錯'utf-8' codec can't decode byte 0xff in position 1: invalid start byte

遇到這個問題,實在無語,我懷疑后面的評論是新出的 emjoy,然后utf-8不能識別,程序掛掉了。但是選取其他格式,在解釋的過程估計還會掛掉,就暫時爬到1萬條吧。

四、完整代碼

代碼倉庫

以上就是python 爬取騰訊視頻評論的實現步驟的詳細內容,更多關于python 爬取騰訊視頻評論的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • Python爬取騰訊視頻評論的思路詳解
  • 使用python實現抓取騰訊視頻所有電影的爬蟲
  • 基于python實現的抓取騰訊視頻所有電影的爬蟲
  • Python爬蟲小練習之爬取并分析騰訊視頻m3u8格式

標簽:烏蘭察布 平頂山 海南 哈爾濱 烏蘭察布 合肥 大慶 郴州

巨人網絡通訊聲明:本文標題《python 爬取騰訊視頻評論的實現步驟》,本文關鍵詞  python,爬取,騰訊,視頻,評論,;如發(fā)現本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python 爬取騰訊視頻評論的實現步驟》相關的同類信息!
  • 本頁收集關于python 爬取騰訊視頻評論的實現步驟的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    激情欧美一区二区| 午夜av区久久| 久久久精品tv| 精品人在线二区三区| 欧美一级日韩一级| 精品精品国产高清a毛片牛牛| 欧美日韩国产一级二级| 欧美性猛片aaaaaaa做受| 在线亚洲人成电影网站色www| 一本一本大道香蕉久在线精品 | 亚洲成年人影院| 丝袜诱惑亚洲看片| 免费高清不卡av| 国产中文一区二区三区| 国产精品一区二区免费不卡| 丰满白嫩尤物一区二区| 色乱码一区二区三区88| 欧美日韩精品免费观看视频| 日韩欧美国产一区在线观看| 久久人人爽爽爽人久久久| 国产精品久久久久久福利一牛影视 | 极品少妇xxxx精品少妇偷拍| 国产精品一区三区| 99re视频这里只有精品| 欧美揉bbbbb揉bbbbb| 日韩精品综合一本久道在线视频| 国产欧美久久久精品影院| 亚洲欧美日韩一区二区 | 精品美女在线观看| 1区2区3区欧美| 日韩精品1区2区3区| 国产精品一品二品| 欧美日精品一区视频| 久久你懂得1024| 亚洲精品高清视频在线观看| 麻豆精品一区二区av白丝在线| 粉嫩aⅴ一区二区三区四区| 91官网在线观看| 久久久精品中文字幕麻豆发布| 亚洲欧洲成人自拍| 激情综合色播激情啊| 91福利资源站| 国产欧美日韩视频在线观看| 亚洲第一福利一区| 99re这里只有精品视频首页| 欧美不卡在线视频| 亚洲成人免费视| 99久久精品情趣| 精品国产露脸精彩对白| 亚洲狠狠丁香婷婷综合久久久| 另类小说一区二区三区| 欧美日韩精品三区| 亚洲久本草在线中文字幕| 黑人精品欧美一区二区蜜桃| 精品视频一区二区三区免费| 欧美国产日产图区| 国产真实乱偷精品视频免| 欧美猛男超大videosgay| 日韩理论在线观看| 成人视屏免费看| 国产日韩欧美精品在线| 久88久久88久久久| 精品国精品自拍自在线| 免费看日韩a级影片| 欧美日韩亚洲综合| 亚洲第四色夜色| 欧美日韩国产一二三| 亚洲自拍偷拍欧美| 欧美视频三区在线播放| 亚洲精选在线视频| 91精品1区2区| 一区二区国产盗摄色噜噜| 暴力调教一区二区三区| 中文字幕第一区第二区| 粉嫩高潮美女一区二区三区 | 26uuu久久综合| 久热成人在线视频| 日韩精品影音先锋| 国产在线麻豆精品观看| 国产欧美中文在线| av中文字幕一区| 自拍视频在线观看一区二区| www.日韩大片| 又紧又大又爽精品一区二区| 日本国产一区二区| 丝袜美腿亚洲色图| 欧美r级电影在线观看| 国产在线视视频有精品| 国产精品嫩草99a| 色婷婷久久一区二区三区麻豆| 夜色激情一区二区| 91精品欧美一区二区三区综合在 | 中文字幕中文字幕一区二区| 色综合久久综合网欧美综合网| 一区二区三区四区亚洲| 欧美高清视频一二三区 | 亚洲欧美欧美一区二区三区| 99re热视频精品| 亚洲国产美女搞黄色| 欧美一级艳片视频免费观看| 国产·精品毛片| 综合在线观看色| 日韩欧美高清一区| 成人av在线播放网址| 亚洲一区在线视频观看| 久久久亚洲精品一区二区三区| 99久久国产免费看| 美国十次了思思久久精品导航| 久久综合色综合88| 色伊人久久综合中文字幕| 日本怡春院一区二区| 久久精品一区八戒影视| 在线精品亚洲一区二区不卡| 极品少妇xxxx精品少妇偷拍| 亚洲欧美激情插| 久久久久久影视| 在线播放视频一区| 成人综合在线视频| 蜜臀a∨国产成人精品| 亚洲人成网站在线| 日本一区二区高清| 久久综合国产精品| 8x福利精品第一导航| 91视频免费观看| 成人在线一区二区三区| 蜜桃av一区二区三区电影| 亚洲最新视频在线播放| 国产精品久久久久aaaa| 欧美一级在线观看| 欧美人xxxx| 欧美午夜在线观看| 色婷婷综合久久久久中文一区二区| 国产一区二区不卡| 韩国精品久久久| 激情综合网最新| 精品一区二区三区香蕉蜜桃 | 欧美在线一区二区三区| 成人性视频免费网站| 国产盗摄视频一区二区三区| 日本视频一区二区三区| 亚洲成av人片一区二区三区| 亚洲激情在线播放| 亚洲激情一二三区| 亚洲欧美日韩在线| 亚洲激情校园春色| 亚洲精品日韩一| 亚洲免费看黄网站| 亚洲精品菠萝久久久久久久| 亚洲色图制服诱惑| 一级特黄大欧美久久久| 亚洲三级电影网站| 亚洲一区二区三区四区的| 依依成人精品视频| 亚洲福利视频三区| 日本三级亚洲精品| 蜜臀av性久久久久蜜臀aⅴ流畅| 蜜桃av噜噜一区| 国产综合久久久久久鬼色| 国产一区二区视频在线播放| 国产91在线观看丝袜| eeuss影院一区二区三区| 色综合中文字幕| 欧美乱熟臀69xxxxxx| 欧美疯狂性受xxxxx喷水图片| 欧美久久婷婷综合色| 精品捆绑美女sm三区| 欧美韩国日本一区| 亚洲在线视频一区| 蜜桃视频一区二区三区在线观看| 激情综合网最新| 96av麻豆蜜桃一区二区| 欧美日本精品一区二区三区| 日韩一区二区三区电影在线观看| 久久欧美一区二区| 亚洲精品一二三区| 免费成人小视频| 一本色道久久综合狠狠躁的推荐| 9191成人精品久久| 中文字幕一区二区三区在线观看 | 日本精品一级二级| 日韩免费观看高清完整版在线观看| 亚洲精品一线二线三线| 综合激情成人伊人| 韩国成人福利片在线播放| 91蜜桃视频在线| 久久伊人中文字幕| 一区二区三区91| 丁香天五香天堂综合| 精品视频在线视频| 国产精品乱码久久久久久 | 久久久久久久久久久久久夜| 亚洲欧美自拍偷拍色图| 激情另类小说区图片区视频区| 色综合久久久久久久| 久久综合九色欧美综合狠狠| 亚洲国产日韩综合久久精品| 国产老女人精品毛片久久| 欧美日韩和欧美的一区二区| 中文字幕 久热精品 视频在线| 免费精品99久久国产综合精品|