婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲和反爬技術(shù)過程詳解

Python爬蟲和反爬技術(shù)過程詳解

熱門標(biāo)簽:萊蕪電信外呼系統(tǒng) 高德地圖標(biāo)注收入咋樣 地圖標(biāo)注多個 鶴壁手機(jī)自動外呼系統(tǒng)違法嗎 銀川電話機(jī)器人電話 沈陽防封電銷電話卡 企業(yè)微信地圖標(biāo)注 怎么辦理400客服電話 B52系統(tǒng)電梯外呼顯示E7

一、瀏覽器模擬(Headers)

瀏覽器模擬是最常用的一種反爬方式。設(shè)想一下:一個網(wǎng)站不停的被同一個版本的瀏覽器頻率的訪問,那大概了就要被認(rèn)為是機(jī)器人了。所以上有政策下有對策,我們每次訪問都使用不同的瀏覽器版本信息不就可以了嗎。首先我們來看一下如何找到自己瀏覽器信息。

如何找到瀏覽器信息

打開瀏覽器,按F12(或者鼠標(biāo)右鍵+檢查)

點擊如下圖所示的Network按鈕

按鍵盤Ctrl+R(MAC:Command+R)進(jìn)行抓包

操作完上一步之后,隨便點擊右側(cè)name中的一項,即可出現(xiàn)下面的頁面,紅框中的內(nèi)容就是我們要找的瀏覽器信息了。

備注:有一些網(wǎng)站會帶有Referer信息,這里的作用主要是在于告訴瀏覽器你是從哪個網(wǎng)址跳轉(zhuǎn)過來的,類似于P站這種站點就會進(jìn)行相應(yīng)的檢查,所以我們可以通過上述同樣的方式找到瀏覽器的Referer信息。如下圖紅框所示:

通過上面的步驟,我們就能夠成功的得到瀏覽器的版本信息了,如果能夠獲得不同的版本信息我們就能夠模擬不同的瀏覽器進(jìn)行操作了。

在Python中使用user-agent的方式如下:

headers = {
  			'Referer': '具體的Referer',
            'User-Agent': '具體的user-agent'
    }
requests.get(url,headers=headers)

常用的請求頭(模擬瀏覽器)信息如下:

User_Agent = [
    "Mozilla/5.0 (iPod; U; CPU iPhone OS 4_3_2 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8H7 Safari/6533.18.5",
    "Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_2 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8H7 Safari/6533.18.5",
    "MQQBrowser/25 (Linux; U; 2.3.3; zh-cn; HTC Desire S Build/GRI40;480*800)",
    "Mozilla/5.0 (Linux; U; Android 2.3.3; zh-cn; HTC_DesireS_S510e Build/GRI40) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1",
    "Mozilla/5.0 (SymbianOS/9.3; U; Series60/3.2 NokiaE75-1 /110.48.125 Profile/MIDP-2.1 Configuration/CLDC-1.1 ) AppleWebKit/413 (KHTML, like Gecko) Safari/413",
    "Mozilla/5.0 (iPad; U; CPU OS 4_3_3 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Mobile/8J2",
    "Mozilla/5.0 (Windows NT 5.2) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.122 Safari/534.30",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_2) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.202 Safari/535.1",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_2) AppleWebKit/534.51.22 (KHTML, like Gecko) Version/5.1.1 Safari/534.51.22",
    "Mozilla/5.0 (iPhone; CPU iPhone OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A5313e Safari/7534.48.3",
    "Mozilla/5.0 (iPhone; CPU iPhone OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A5313e Safari/7534.48.3",
    "Mozilla/5.0 (iPhone; CPU iPhone OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A5313e Safari/7534.48.3",
    "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.202 Safari/535.1",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows Phone OS 7.5; Trident/5.0; IEMobile/9.0; SAMSUNG; OMNIA7)",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0; XBLWP7; ZuneWP7)",
    "Mozilla/5.0 (Windows NT 5.2) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.122 Safari/534.30",
    "Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0",
    "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.2; Trident/4.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET4.0E; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C)",
    "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.2; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET4.0E; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C)",
    "Mozilla/4.0 (compatible; MSIE 60; Windows NT 5.1; SV1; .NET CLR 2.0.50727)",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)",
    "Opera/9.80 (Windows NT 5.1; U; zh-cn) Presto/2.9.168 Version/11.50",
    "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)",
    "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022; .NET4.0E; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C)",
    "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN) AppleWebKit/533.21.1 (KHTML, like Gecko) Version/5.0.5 Safari/533.21.1",
    "Mozilla/5.0 (Windows; U; Windows NT 5.1; ) AppleWebKit/534.12 (KHTML, like Gecko) Maxthon/3.0 Safari/534.12",
    "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld)",
    "Opera/9.80 (X11; Linux i686; Ubuntu/14.10) Presto/2.12.388 Version/12.16",
    "Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14",
    "Mozilla/5.0 (Windows NT 6.0; rv:2.0) Gecko/20100101 Firefox/4.0 Opera 12.14",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0) Opera 12.14",
    "Opera/12.80 (Windows NT 5.1; U; en) Presto/2.10.289 Version/12.02",
    "Opera/9.80 (Windows NT 6.1; U; es-ES) Presto/2.9.181 Version/12.00",
    "Opera/9.80 (Windows NT 5.1; U; zh-sg) Presto/2.9.181 Version/12.00",
    "Opera/12.0(Windows NT 5.2;U;en)Presto/22.9.168 Version/12.00",
    "Opera/12.0(Windows NT 5.1;U;en)Presto/22.9.168 Version/12.00",
    "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1",
    "Mozilla/5.0 (Windows NT 6.3; rv:36.0) Gecko/20100101 Firefox/36.0",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10; rv:33.0) Gecko/20100101 Firefox/33.0",
    "Mozilla/5.0 (X11; Linux i586; rv:31.0) Gecko/20100101 Firefox/31.0",
    "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:31.0) Gecko/20130401 Firefox/31.0",
    "Mozilla/5.0 (Windows NT 5.1; rv:31.0) Gecko/20100101 Firefox/31.0",
    "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20120101 Firefox/29.0",
    "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/29.0",
    "Mozilla/5.0 (X11; OpenBSD amd64; rv:28.0) Gecko/20100101 Firefox/28.0",
    "Mozilla/5.0 (X11; Linux x86_64; rv:28.0) Gecko/20100101  Firefox/28.0",
    "Mozilla/5.0 (Windows NT 6.1; rv:27.3) Gecko/20130101 Firefox/27.3",
    "Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:27.0) Gecko/20121011 Firefox/27.0",
    "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:25.0) Gecko/20100101 Firefox/25.0",
    "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:24.0) Gecko/20100101 Firefox/24.0",
    "Mozilla/5.0 (Windows NT 6.0; WOW64; rv:24.0) Gecko/20100101 Firefox/24.0",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:24.0) Gecko/20100101 Firefox/24.0"
]

二、IP代理

除了通過同一個瀏覽器進(jìn)行訪問,還可能出現(xiàn)的情況就是通過同一個IP不斷的訪問網(wǎng)址,這樣很容易造成整個IP被封,個人的IP還好,如果一個公司的IP都不能訪問某個網(wǎng)站,那將會是怎樣的效果就不用多說了吧。

對于IP來說除了需要控制IP地址的變更之外,還要控制訪問速度,畢竟程序快起來是不眨眼的。

Python使用IP代理的方式如下:

import requests
proxies = {"http": 'IP地址'}
requests.get(url, headers=headers, proxies=proxies)

注:關(guān)于代理IP去哪找的問題,網(wǎng)上一搜一大把,我們放心大膽的使用就可以了。

控制訪問頻率使用time模塊即可:

import time
time.sleep(5)

三、Cookies模擬

有很多時候我們訪問網(wǎng)址會遇到403錯誤,一般這種情況表示無權(quán)訪問請求的資源,通常在沒有設(shè)置cookie或是沒有設(shè)置正確的cookie會導(dǎo)致這個錯誤。cookie的存在就像是一個網(wǎng)址的通行證,你會發(fā)現(xiàn)在你登陸和未登陸網(wǎng)頁的時候cookie是會發(fā)生變化的。

手動獲取cookie

我們可以通過和獲取user-agent一樣的方式來手動獲取cookie:

自動獲取cookie

我們使用session方法就能夠?qū)崿F(xiàn)自動獲取cookie了

示例代碼如下:

import requests
session = requests.session()
session.cookies = LWPCookieJar(filename='Cookies.txt')
def login():
    name = input("輸入賬戶:")
    password = input("輸入密碼:")
    url = "url"
    data = {
        "ck": "",
        "name": name,
        "password": password,
        "remember": "True",
        "ticket": "",
    }
    response = session.post(url, data=data)
    print(response.text)
    session.cookies.save()  # 保存 cookie

這樣我們的cookie就能夠得以保存了。

使用session加載cookie的方式如下:

session.cookies = LWPCookieJar(filename='Cookies.txt')
session.cookies.load(ignore_discard=True)

使用cookies

當(dāng)我們有了cookies時,使用起來就簡單很多了,直接使用和加載user-agent一樣的方式即可。

headers = {
  			'Referer': '具體的Referer',
        'User-Agent': '具體的user-agent',
  			'Cookie': 'cookie'
    }
requests.get(url,headers=headers)

對于反爬的一些基礎(chǔ)操作就介紹完了更多關(guān)于Python爬蟲和反爬技術(shù)的資料請關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • 關(guān)于python爬蟲應(yīng)用urllib庫作用分析
  • python爬蟲Scrapy框架:媒體管道原理學(xué)習(xí)分析
  • python爬蟲Mitmproxy安裝使用學(xué)習(xí)筆記
  • python爬蟲之Appium爬取手機(jī)App數(shù)據(jù)及模擬用戶手勢
  • 爬蟲Python驗證碼識別入門
  • Python爬蟲技術(shù)
  • Python爬蟲爬取商品失敗處理方法
  • Python獲取江蘇疫情實時數(shù)據(jù)及爬蟲分析
  • Python爬蟲之Scrapy環(huán)境搭建案例教程
  • Python爬蟲中urllib3與urllib的區(qū)別是什么
  • 教你如何利用python3爬蟲爬取漫畫島-非人哉漫畫
  • Python爬蟲分析匯總

標(biāo)簽:呼倫貝爾 三亞 葫蘆島 安慶 呼倫貝爾 銀川 烏魯木齊 湘西

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬蟲和反爬技術(shù)過程詳解》,本文關(guān)鍵詞  Python,爬蟲,和,反爬,技術(shù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬蟲和反爬技術(shù)過程詳解》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python爬蟲和反爬技術(shù)過程詳解的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    91精品久久久久久久91蜜桃| 欧美老人xxxx18| 午夜精品福利视频网站| 中文字幕在线观看一区二区| 一区二区三区成人在线视频| 亚洲成av人片在www色猫咪| 韩国成人在线视频| 欧美日韩免费在线视频| 国产精品久久久久7777按摩| 狠狠色丁香久久婷婷综| 欧美美女bb生活片| 日韩精品福利网| 欧美日韩高清一区二区| 国产精品久久网站| 成av人片一区二区| 国产精品久久毛片av大全日韩| 精品亚洲欧美一区| 国产午夜精品在线观看| 日韩精品免费视频人成| 日韩欧美一级精品久久| 国产suv精品一区二区883| 亚洲图片一区二区| 国产91丝袜在线播放九色| 中文字幕不卡在线观看| 99国产精品视频免费观看| 亚洲免费高清视频在线| 欧美日韩午夜精品| 久久成人免费网| 中文欧美字幕免费| 欧美顶级少妇做爰| 国内不卡的二区三区中文字幕| 国产亚洲精品bt天堂精选| 日本高清免费不卡视频| 麻豆精品一区二区三区| 亚洲欧洲性图库| 7799精品视频| jlzzjlzz国产精品久久| 亚洲一区二区在线观看视频 | 99久久亚洲一区二区三区青草| 成人免费一区二区三区视频 | 91久久国产综合久久| 老司机午夜精品| 一区二区三区中文在线| 国产欧美视频一区二区三区| 精品精品国产高清a毛片牛牛| 欧美日韩中文字幕精品| 成人激情免费视频| 成人小视频免费在线观看| 国产一本一道久久香蕉| 日本免费在线视频不卡一不卡二| 亚洲天天做日日做天天谢日日欢| 国产丝袜欧美中文另类| 欧美va亚洲va| 国产欧美日韩另类视频免费观看| 久久精品一区四区| 欧美在线看片a免费观看| 日韩黄色在线观看| 经典三级一区二区| 精品在线播放午夜| 国产精品一二三区| 99视频在线精品| 在线免费亚洲电影| 久久综合资源网| 亚洲色图自拍偷拍美腿丝袜制服诱惑麻豆 | 日日欢夜夜爽一区| 美国av一区二区| 国产91色综合久久免费分享| 国产成人免费av在线| 色域天天综合网| 精品国产一区二区在线观看| 中文字幕av一区二区三区免费看 | 中文字幕一区二区三区色视频 | 久久久夜色精品亚洲| 亚洲一区在线观看免费 | 欧美日本一区二区| 欧美国产精品专区| 久久99精品久久久久婷婷| 色天使色偷偷av一区二区| 国产女同互慰高潮91漫画| 亚洲在线一区二区三区| 91丨九色丨尤物| 久久精品欧美一区二区三区麻豆| 日韩中文字幕一区二区三区| 色综合久久中文综合久久牛| 中文字幕中文字幕一区二区| 在线免费观看日本欧美| 一区二区欧美国产| 欧美激情一区二区在线| 一区二区三区四区av| 丰满白嫩尤物一区二区| 久久亚洲精品国产精品紫薇| 国产中文字幕精品| 久久久久久久综合色一本| 久久精品久久精品| 中文字幕乱码日本亚洲一区二区| 国产一二三精品| 国产精品乱人伦| 欧美视频你懂的| 久久国产精品第一页| 国产精品色在线| 欧美日韩一区不卡| 国产精品综合网| 亚洲国产aⅴ天堂久久| 欧美成人在线直播| 色偷偷久久人人79超碰人人澡| 秋霞电影一区二区| 国产精品美女一区二区| 91麻豆精品国产无毒不卡在线观看| 久久99久久精品| 亚洲成年人网站在线观看| 国产精品网站在线观看| 日韩欧美123| 欧美男人的天堂一二区| 色婷婷香蕉在线一区二区| 国产呦萝稀缺另类资源| 乱中年女人伦av一区二区| 亚洲女女做受ⅹxx高潮| 欧美国产激情一区二区三区蜜月| 欧美一级片在线看| 日韩一区二区三区电影| 91精品在线一区二区| 91免费视频网址| av亚洲精华国产精华精| 床上的激情91.| 懂色av一区二区夜夜嗨| 国产精品 日产精品 欧美精品| 日韩 欧美一区二区三区| 蜜桃视频一区二区| 秋霞午夜av一区二区三区| 蜜桃视频在线观看一区| 国产亚洲欧洲一区高清在线观看| 激情综合网激情| 国产一区二区导航在线播放| 狠狠色丁香婷婷综合久久片| 美脚の诱脚舐め脚责91 | 在线观看91av| 精品电影一区二区| 中文字幕一区二区5566日韩| 一区二区三区毛片| 韩国三级在线一区| 99综合影院在线| 7777精品伊人久久久大香线蕉超级流畅| 欧美精品aⅴ在线视频| 国产欧美精品在线观看| 日韩影院免费视频| 91国在线观看| 中文在线资源观看网站视频免费不卡 | 亚洲欧洲精品一区二区三区| 性欧美大战久久久久久久久| 国产精品99久久久久久久女警| 91久久免费观看| 中文字幕在线不卡视频| 国产精一区二区三区| 4438x成人网最大色成网站| 一区二区三区精品久久久| 国产大片一区二区| 久久久久久麻豆| 国产一区二区三区免费看| 精品国产乱码久久久久久浪潮| 天天色综合成人网| 欧美日韩夫妻久久| 日本中文字幕不卡| 欧美草草影院在线视频| 男人操女人的视频在线观看欧美| 在线综合亚洲欧美在线视频| 奇米一区二区三区av| 久久网站热最新地址| 岛国一区二区三区| 一区二区成人在线| 日韩欧美亚洲另类制服综合在线| 蜜臂av日日欢夜夜爽一区| 国产成人精品在线看| 欧美在线看片a免费观看| 亚洲免费成人av| 日韩亚洲欧美在线| 岛国av在线一区| 午夜免费久久看| 国产女同互慰高潮91漫画| 欧美日免费三级在线| 国产麻豆视频一区二区| 亚洲精品成人悠悠色影视| 精品少妇一区二区三区在线播放 | 欧美精品日韩精品| 黄色日韩三级电影| 一区二区视频在线看| 久久亚洲精品小早川怜子| 在线免费观看成人短视频| 免费久久精品视频| 亚洲五码中文字幕| 国产精品麻豆网站| 精品国产伦一区二区三区观看方式 | 日韩—二三区免费观看av| 亚洲婷婷在线视频| 亚洲国产成人自拍| 精品电影一区二区| 精品国产凹凸成av人导航| 欧美精品免费视频| 在线成人小视频| 制服.丝袜.亚洲.中文.综合| 欧美在线观看视频一区二区 |