婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > python反扒機制的5種解決方法

python反扒機制的5種解決方法

熱門標簽:深圳網(wǎng)絡外呼系統(tǒng)代理商 柳州正規(guī)電銷機器人收費 鎮(zhèn)江人工外呼系統(tǒng)供應商 高德地圖標注字母 申請辦個400電話號碼 外呼系統(tǒng)前面有錄音播放嗎 騰訊地圖標注有什么版本 400電話辦理費用收費 千呼ai電話機器人免費

前言

反爬蟲是網(wǎng)站為了維護自己的核心安全而采取的抑制爬蟲的手段,反爬蟲的手段有很多種,一般情況下除了百度等網(wǎng)站,反扒機制會常常更新以外。為了保持網(wǎng)站運行的高效,網(wǎng)站采取的反扒機制并不是太多,今天分享幾個我在爬蟲過程中遇到的反扒機制,并簡單介紹其解決方式。

基于User-Agent反爬

簡介:服務器后臺對訪問的User_Agent進行統(tǒng)計,單位時間內同一User_Agent訪問的次數(shù)超過特定的閥值,則會被不同程度的封禁IP,從而造成無法進行爬蟲的狀況。

解決方法:

一 . 將常見的User-Agent放到ua_list中,以列表形式進行隨機使用

代碼示例:

二. 加載fake_useragent庫,隨機生成User-Agent添加到headers中

代碼示例:

2 基于IP反爬

簡介: 爬蟲程序可能會在短時間內對指定的服務器發(fā)起高頻的請求。后臺服務器對訪問進行統(tǒng)計,單位時間內同一IP訪問的次數(shù)超過一個特定的值(閥值),就會不同程度的禁封IP,導致無法進行爬蟲操作。

解決方法:使用代理池,并設定延遲訪問

如何獲取代理服務器?免費:西祠代理、快代理、goubanjia 收費:代理精靈等

代碼示例:

3 基于cookie反扒

簡介:網(wǎng)站會通過cookie跟蹤你的訪問過程,如果發(fā)現(xiàn)有爬蟲行為會立刻中斷你的訪問,比如特別快的填寫表單,或者短時間內瀏覽大量頁面。而正確地處理cookie,又可以避免很多采集問題,建議在采集網(wǎng)站過程中,檢查一下這些網(wǎng)站生成的cookie,然后想想哪一個是爬蟲需要處理的。

解決方法:

一 手動處理

將cookie封裝到headers字典中,將該字典作用到get/post方法的headers參數(shù)中

二 自動處理

需要兩次處理。第一次是為了捕獲和存儲cookie到session對象中,第二次就是用攜帶cookie的session進行請求發(fā)送,這次請求發(fā)送就是攜帶cookie發(fā)起的請求??梢愿鷕equests一樣調用get/post進行請求的發(fā)送。在使用session進行請求發(fā)送的過程中,如果產(chǎn)生了cookie,則cookie會被自動存儲session對象中

代碼示例:

#基于session自動處理
cookiesess = requests.Session() 
#該次請求只是為了捕獲cookie存儲到sess中
sess.get(url='https://xueqiu.com/',headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json?since_id=-1max_id=20367942count=15category=-1'
json_data = sess.get(url=url,headers=headers).json()json_data

4 圖片懶加載

簡介:圖片懶加載是一種網(wǎng)頁優(yōu)化技術。圖片作為一種網(wǎng)絡資源,在被請求時也與普通靜態(tài)資源一樣,將占用網(wǎng)絡資源,而一次性將整個頁面的所有圖片加載完,將大大增加頁面的首屏加載時間。為了解決這種問題,通過前后端配合,使圖片僅在瀏覽器當前視窗內出現(xiàn)時才加載該圖片,達到減少首屏圖片請求數(shù)的技術就被稱為“圖片懶加載”。在網(wǎng)頁源碼中,在img標簽中首先會使用一個“偽屬性”(通常使用src2,original......)去存放真正的圖片鏈接而并非是直接存放在src屬性中。當圖片出現(xiàn)到頁面的可視化區(qū)域中,會動態(tài)將偽屬性替換成src屬性,完成圖片的加載。

解決方法:通過細致觀察頁面的結構,發(fā)現(xiàn)圖片的鏈接真正鏈的偽屬性中,一般不在src中,而是src2中,xpath要使用該屬性

示例代碼:

5 Ajax動態(tài)加載

簡介:從網(wǎng)頁的 url 加載網(wǎng)頁的源代碼之后,會在瀏覽器里執(zhí)行JavaScript程序。這些程序會加載出更多的內容,并把這些內容傳輸?shù)骄W(wǎng)頁中。這就是為什么有些網(wǎng)頁直接爬它的URL時卻沒有數(shù)據(jù)的原因。現(xiàn)在這樣的網(wǎng)站也越來越多。
解決方法:使用審查元素分析”請求“對應的鏈接(方法:右鍵→審查元素→Network→清空,點擊”加載更多“,出現(xiàn)對應的GET鏈接尋找Type為text/html的,點擊,查看get參數(shù)或者復制Request URL),循環(huán)過程。如果“請求”之前有頁面,依據(jù)上一步的網(wǎng)址進行分析推導第1頁。以此類推,抓取抓Ajax地址的數(shù)據(jù)。對返回的json使用requests中的json進行解析,觀察動態(tài)加載的規(guī)律,在請求頭中對規(guī)律進行使用

抓包工具推薦:fiddler

到此這篇關于python反扒機制的5種解決方法的文章就介紹到這了,更多相關python反扒機制內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python爬蟲實例扒取2345天氣預報
  • python解決網(wǎng)站的反爬蟲策略總結
  • python爬蟲的一個常見簡單js反爬詳解
  • 詳解python 破解網(wǎng)站反爬蟲的兩種簡單方法
  • python通過偽裝頭部數(shù)據(jù)抵抗反爬蟲的實例
  • Python反爬蟲偽裝瀏覽器進行爬蟲
  • Python常見反爬蟲機制解決方案
  • python 常見的反爬蟲策略
  • python中繞過反爬蟲的方法總結

標簽:郴州 大慶 海南 平頂山 烏蘭察布 合肥 哈爾濱 烏蘭察布

巨人網(wǎng)絡通訊聲明:本文標題《python反扒機制的5種解決方法》,本文關鍵詞  python,反扒,機制,的,5種,;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python反扒機制的5種解決方法》相關的同類信息!
  • 本頁收集關于python反扒機制的5種解決方法的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    欧美日韩一区二区三区在线看| 国产午夜精品一区二区三区视频| 国产精品乡下勾搭老头1| 日韩精品一级二级 | 蜜臀av一区二区| 国产在线视频一区二区| 成人性生交大片| 91福利国产成人精品照片| 欧美日韩精品一区二区| 欧美不卡一区二区| 国产精品私人影院| 亚洲高清免费视频| 久久99精品久久久| 色综合欧美在线| 日韩欧美国产电影| 久久这里都是精品| 亚洲婷婷在线视频| 午夜精品国产更新| 懂色一区二区三区免费观看| 日本韩国一区二区三区视频| 日韩一区二区三区视频在线| 亚洲免费观看视频| 国产一区二区免费看| 色婷婷久久综合| 久久久久国色av免费看影院| 亚洲国产另类av| 成人污污视频在线观看| 日韩一卡二卡三卡四卡| 国产精品美女久久久久久久久久久| 丝袜亚洲精品中文字幕一区| 99久久99久久精品免费看蜜桃 | 亚洲欧美aⅴ...| 久久国产三级精品| 欧美日韩中文国产| 亚洲女女做受ⅹxx高潮| 成人一级视频在线观看| 欧美白人最猛性xxxxx69交| 亚洲最大的成人av| 9久草视频在线视频精品| 日韩欧美综合在线| 五月激情综合网| 欧洲精品中文字幕| 亚洲同性gay激情无套| 福利一区二区在线| 久久青草欧美一区二区三区| 日韩高清不卡一区二区| 色综合久久综合网| 日本一区二区三区高清不卡| 国产乱子轮精品视频| 在线电影院国产精品| 亚洲自拍偷拍网站| 欧美在线不卡视频| 亚洲欧美另类图片小说| 92国产精品观看| 欧美经典一区二区| 美女mm1313爽爽久久久蜜臀| 在线成人免费视频| 日本欧美大码aⅴ在线播放| 欧美日韩一区二区三区在线看| 国产精品欧美综合在线| 成人精品视频一区| 中文字幕av不卡| 国产99久久久久久免费看农村| 2020国产成人综合网| 国产精品系列在线观看| 久久精品水蜜桃av综合天堂| 国产在线麻豆精品观看| 国产日产欧美一区二区三区| 九九热在线视频观看这里只有精品| 欧美久久久一区| 不卡的av电影| 久久丁香综合五月国产三级网站| 国产精品综合网| 国产日韩成人精品| 国产精品一区二区免费不卡 | 日韩欧美一级精品久久| 五月天精品一区二区三区| 欧美日本一区二区三区四区| 亚洲黄色性网站| 在线观看视频91| 奇米精品一区二区三区在线观看一| 日本韩国欧美在线| 天天综合网天天综合色| ww亚洲ww在线观看国产| 成人一区二区视频| 一区二区三区久久| 91精品国产色综合久久ai换脸| 捆绑变态av一区二区三区| wwww国产精品欧美| 99视频一区二区三区| 亚洲大片在线观看| 精品美女一区二区| 不卡影院免费观看| 亚洲欧美日韩中文播放 | 久久天天做天天爱综合色| 国产成a人无v码亚洲福利| 亚洲美女免费在线| 日韩精品一区二区三区三区免费 | 欧洲激情一区二区| 日韩国产一区二| 精品久久久久久久人人人人传媒| 97久久精品人人澡人人爽| 日韩成人av影视| 国产精品久久久久永久免费观看| 欧美日韩中文国产| 国产午夜精品美女毛片视频| 欧美亚洲综合久久| 国产成人午夜精品5599| 香蕉成人伊视频在线观看| 久久精品人人爽人人爽| 欧美日韩国产天堂| 成人国产精品免费网站| 免费观看一级欧美片| 亚洲色图视频网| 亚洲精品在线观| 337p亚洲精品色噜噜| 日本精品一级二级| 成人一道本在线| 久久99久国产精品黄毛片色诱| 亚洲精品国产第一综合99久久| 国产午夜精品福利| 在线综合亚洲欧美在线视频| 91黄色免费网站| 欧美午夜不卡视频| 懂色av中文字幕一区二区三区| 国产成人免费视频一区| 欧美日韩黄视频| 色综合天天综合网天天狠天天| xvideos.蜜桃一区二区| 欧美年轻男男videosbes| 99精品偷自拍| 国产a级毛片一区| 国产一区二区三区在线观看免费视频| 午夜精品爽啪视频| 中文字幕免费观看一区| 精品成人一区二区三区| 日韩一级黄色大片| 日韩精品一区二区三区中文精品| 欧美日韩一区 二区 三区 久久精品| 99久久精品国产精品久久| 成人精品国产一区二区4080| 国产福利一区在线| 国产寡妇亲子伦一区二区| 久久国产精品99精品国产| 免费高清在线视频一区·| 日韩精品乱码免费| 婷婷开心激情综合| 亚洲综合色在线| 亚洲国产视频网站| 亚洲国产婷婷综合在线精品| 亚洲成av人片一区二区梦乃| 日韩精品一级二级 | 欧美性猛交xxxxxxxx| 91美女片黄在线观看| 久久综合久久综合久久| 久久伊人蜜桃av一区二区| 欧美不卡视频一区| 精品欧美一区二区在线观看| 欧美大片在线观看一区| 日韩一区二区在线播放| www成人在线观看| 亚洲国产高清不卡| 亚洲图片激情小说| 亚洲综合一二区| 亚洲成人av免费| 图片区小说区国产精品视频| 日韩成人一级片| 国产大片一区二区| zzijzzij亚洲日本少妇熟睡| 91福利区一区二区三区| 337p亚洲精品色噜噜| 久久久不卡网国产精品二区| 1区2区3区精品视频| 亚洲国产成人高清精品| 狠狠网亚洲精品| 成人福利电影精品一区二区在线观看| 色综合久久综合| 欧美日本在线视频| 久久伊人中文字幕| 亚洲精品五月天| 日韩av电影免费观看高清完整版 | 日本不卡视频在线观看| 国产精品综合在线视频| 日本道色综合久久| 欧美成人在线直播| 亚洲欧美福利一区二区| 麻豆精品在线观看| 99久久99久久综合| 欧美一区二区三区性视频| 国产精品私人影院| 全国精品久久少妇| 99久久er热在这里只有精品15| 欧美成人性战久久| 一区二区三区自拍| 国产一区91精品张津瑜| 欧美三级日韩在线| 国产欧美日产一区| 日韩不卡手机在线v区| 97精品久久久午夜一区二区三区 | 日韩成人精品在线观看|