婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > python爬蟲實戰之制作屬于自己的一個IP代理模塊

python爬蟲實戰之制作屬于自己的一個IP代理模塊

熱門標簽:地圖標注面積 所得系統電梯怎樣主板設置外呼 北京電銷外呼系統加盟 佛山400電話辦理 市場上的電銷機器人 朝陽手機外呼系統 小蘇云呼電話機器人 儋州電話機器人 北瀚ai電銷機器人官網手機版

一、使用PyChram的正則

首先,小編講的不是爬取ip,而是講了解PyCharm的正則,這里講的正則不是Python的re模塊哈!
而是PyCharm的正則功能,我們在PyChram的界面上按上Ctrl+R,可以發現,這里出現兩行輸入框

現在如果小編想把如下數據轉換成一個字典存儲

讀者也許會一個一去改,但是小編只需在上述的那兩個輸入框內,輸入一串字符串即可。

只需在第一個輸入框中,輸入(.*) : (.*)
在第二個輸入框中,輸入"$1":"$2",,看看效果如何

之后再給兩端分別一個花括號和取一個字典名稱即可。

二、制作一個隨機User-Agent模塊

反爬措施中,有這樣一條,就是服務器會檢查請求的user-agent參數值,如果檢查的結果為python,那么服務器就知道這是爬蟲,為了避免被服務器發現這是爬蟲,通常user-agent參數值會設置瀏覽器的值,但是爬取一個網址時,每次都需要查看網址network下面的內容,顯得比較繁瑣,為什么不自定義一個隨機獲取user-agent的值模塊呢?這樣既可以減少查看network帶來的繁瑣,同時還可以避免服務器發現這是同一個user-agent發起多次請求。
說了這么多,那么具體怎樣實現呢?

只需調用隨機模塊random的方法choice()即可,這個方法里面的參數類型時列表類型,具體參考代碼如下:

import random

class useragent(object):

    def getUserAgent(self):
        useragents=[
            'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36',
            'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1',
            'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0',
            'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 2.0.50727; SLCC2; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; InfoPath.3; .NET4.0C; Tablet PC 2.0; .NET4.0E)',
            'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)',
        ]
        return random.choice(useragents)

這樣我們就可以隨機得到一個user-agent的值了。

三、最終實踐

3.1 爬取快代理上的ip

接下來,就是最終實踐了,制作屬于自己的IP代理模塊。

那么,從哪里獲取IP呢?小編用的是快代理這個網址,網址鏈接為:https://www.kuaidaili.com/free/inha/1/。

怎樣提取IP呢?小編用的是xpath語法

參考代碼如下:

import requests
from crawlers.userAgent import useragent  # 導入自己自定義的類,主要作用為隨機取user-agent的值
from lxml import etree

url='https://www.kuaidaili.com/free/inha/1/'
headers={'user-agent':useragent().getUserAgent()}
rsp=requests.get(url=url,headers=headers)
HTML=etree.HTML(rsp.text)
infos=HTML.xpath("http://table[@class='table table-bordered table-striped']/tbody/tr")
for info in infos:
    print(info.xpath('./td[1]/text()'))   # ip
    print(info.xpath('./td[2]/text()'))   # ip對應的端口 列表類型

怎樣爬取多頁呢?分析快代理那個網址,可以發現https://www.kuaidaili.com/free/inha/{頁數}/ ,花括號里面就是頁數,這個網址總頁數為4038,這里小編只爬取5頁,并且開始頁數取(1,3000)之間的隨機數,但是如果for循環這個過程,運行結果如下:

原來是請求過快的原因,只需在爬取1頁之后,休眠幾秒鐘即可解決。

3.2 驗證爬取到的ip是否可用

這里直接用百度這個網址作為測試網址,主要代碼為:

url='https://www.baidu.com'
headers={'user-agent':useragent().getUserAgent()}
proxies={}   # ip ,這里只是講一下關鍵代碼,沒有給出具體IP
rsp=requests.get(url=url,headers=headers,proxies=proxies,time=0.2)  # timeout為超時時間

只需判斷rsp的狀態碼為200,如果是,把它添加到一個指定的列表中。

具體參考代碼小編已經上傳到Gitee上,鏈接為:ip代理模塊

當然讀者可用把這個文件保存到python\Lib文件夾下面,這樣就可用隨時隨地導入了。

3.3 實戰:利用爬取到的ip訪問CSDN博客網址1000次



上述出現那個錯誤,小編上網搜索了一下原因,如下:

我想應該是第1種原因,ip被封,我這里沒有設置超時時間,應該不會出現程序請求速度過快。

四、總結

上述那個ip代理模塊還有很多的不足點,比如用它去訪問一些網址時,不管運行多少次,輸出的結果狀態碼不會時200,這也正常,畢竟免費的ip并不是每個都能用的。如果要說改進的話,就是多爬取幾個不同ip代理網址,去重,這樣的結果肯定會比上述的那個ip代理模塊要好

到此這篇關于python爬蟲實戰之制作屬于自己的一個IP代理模塊的文章就介紹到這了,更多相關Python IP代理模塊內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python利用proxybroker構建爬蟲免費IP代理池的實現
  • Python爬蟲設置ip代理過程解析
  • python如何基于redis實現ip代理池
  • python3 Scrapy爬蟲框架ip代理配置的方法
  • Python爬蟲動態ip代理防止被封的方法
  • python實現ip代理池功能示例
  • python單例模式獲取IP代理的方法詳解
  • python3 requests中使用ip代理池隨機生成ip的實例

標簽:寧夏 商丘 酒泉 龍巖 江蘇 定西 云南 金融催收

巨人網絡通訊聲明:本文標題《python爬蟲實戰之制作屬于自己的一個IP代理模塊》,本文關鍵詞  python,爬蟲,實戰,之,制作,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python爬蟲實戰之制作屬于自己的一個IP代理模塊》相關的同類信息!
  • 本頁收集關于python爬蟲實戰之制作屬于自己的一個IP代理模塊的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    国产精品欧美一区二区三区| 亚洲乱码国产乱码精品精98午夜| 国产宾馆实践打屁股91| 夜夜夜精品看看| 无码av中文一区二区三区桃花岛| 国产尤物一区二区| 国产精品午夜在线观看| 精品免费国产二区三区 | 91精品国产综合久久久久久 | 国产成人综合在线| 久久久噜噜噜久久人人看| 欧美一区二区三区在线看| 高清国产一区二区| 偷窥少妇高潮呻吟av久久免费| 欧美一二三四在线| 97精品视频在线观看自产线路二| 中文字幕一区三区| 青青青爽久久午夜综合久久午夜| 日韩一区二区高清| 亚洲欧美另类小说| 国产丝袜在线精品| www.欧美色图| 国产精品麻豆欧美日韩ww| 波多野结衣一区二区三区| 国产精品欧美一区喷水| 亚洲国产sm捆绑调教视频| 欧美日韩日日摸| 亚洲午夜视频在线| 国产不卡免费视频| 亚洲精品在线电影| 亚洲一区二区欧美| 成人国产视频在线观看| 亚洲国产视频直播| 91性感美女视频| 91久久精品午夜一区二区| www欧美成人18+| 爽好多水快深点欧美视频| 国产白丝网站精品污在线入口| 亚洲美女电影在线| 成人精品视频.| www国产亚洲精品久久麻豆| 亚洲综合自拍偷拍| 久久久精品国产99久久精品芒果 | 日本一区二区久久| 美女任你摸久久| 在线免费亚洲电影| 日韩一区二区免费视频| 成人午夜私人影院| 久久蜜桃av一区精品变态类天堂 | 国产精品电影一区二区| 久久电影网站中文字幕 | 亚洲大尺度视频在线观看| 久久夜色精品一区| 久久99精品久久久久久国产越南 | 日本成人在线不卡视频| 亚洲欧洲精品天堂一级| 欧美日本韩国一区二区三区视频| av一区二区三区| 国内精品伊人久久久久av一坑| 亚洲一区二区三区小说| 《视频一区视频二区| 中文字幕精品一区二区三区精品| 精品久久久网站| 日韩一区二区三区三四区视频在线观看| 成人免费观看av| 国产98色在线|日韩| 国产一区福利在线| 欧美bbbbb| 午夜激情综合网| 亚洲韩国精品一区| 依依成人精品视频| 亚洲精品va在线观看| 亚洲欧美日韩国产手机在线| 国产三区在线成人av| 国产午夜三级一区二区三| 欧美日韩久久久| 欧美老年两性高潮| 欧美一级视频精品观看| 欧美精品 国产精品| 在线电影一区二区三区| 91精品国产日韩91久久久久久| 欧美喷潮久久久xxxxx| 6080国产精品一区二区| 日韩免费视频线观看| 欧美v日韩v国产v| 久久久久亚洲蜜桃| 日本一区免费视频| 亚洲视频在线观看一区| 亚洲精品伦理在线| 性久久久久久久久| 另类小说综合欧美亚洲| 精品在线亚洲视频| 成人91在线观看| 欧美在线免费播放| 欧美精品九九99久久| 精品国产免费视频| 亚洲欧洲精品一区二区精品久久久| 亚洲精品少妇30p| 免费观看一级欧美片| 国产成人小视频| 色吧成人激情小说| 欧美日韩一区在线观看| 欧美一级生活片| 久久久久久久久岛国免费| 国产欧美精品在线观看| 亚洲免费观看高清| 视频一区在线播放| 国产乱码精品一区二区三区av| 91久久精品国产91性色tv| 欧美激情在线看| 亚洲美女区一区| 精品一区二区三区日韩| 欧美性猛片xxxx免费看久爱| 国产精品午夜久久| 免费欧美在线视频| 色综合久久久网| 91精品国产乱| 一区精品在线播放| 久久99精品久久久久婷婷| 欧美日韩日本视频| 亚洲黄色av一区| 黑人巨大精品欧美黑白配亚洲| 91福利精品第一导航| 国产精品你懂的在线欣赏| 老司机精品视频在线| 欧美日韩一卡二卡| 国产精品理论片在线观看| 国产在线精品一区二区| 欧美高清视频一二三区| 日韩综合在线视频| 欧美肥妇毛茸茸| 国产精品污www在线观看| 日韩国产一区二| 在线精品视频一区二区三四| 日本韩国欧美一区| 欧美一二三四在线| 亚洲精品一二三四区| 久久精品噜噜噜成人88aⅴ| 99久久久国产精品| 欧美视频在线播放| 国产日韩欧美精品在线| 天天操天天综合网| 国产99久久久精品| 欧洲精品中文字幕| 午夜精品久久一牛影视| 91在线无精精品入口| 国产色综合一区| 国产成人自拍网| 91精品国产日韩91久久久久久| 一区二区三区在线视频免费观看| 国产在线乱码一区二区三区| 国产一区二区三区最好精华液| 欧美大片一区二区| 日韩一区精品字幕| 久久久久久毛片| 国产一区欧美一区| 日韩精品一区二区三区四区视频| 亚洲国产精品一区二区久久恐怖片| 欧美日韩一区二区在线观看视频| 最新国产の精品合集bt伙计| 懂色一区二区三区免费观看| 欧美电影免费观看高清完整版| 视频一区二区中文字幕| 成人美女视频在线观看18| 中文字幕第一页久久| 成人开心网精品视频| 国产亚洲欧洲997久久综合| 国产suv精品一区二区6| 欧美高清在线视频| 99久久精品免费观看| 国产日韩欧美电影| 国产精品2024| 欧美群妇大交群中文字幕| 国产寡妇亲子伦一区二区| 欧美精品一区二区三区四区| 国产精品一区三区| 在线成人免费观看| 蜜桃视频一区二区| 久久蜜桃香蕉精品一区二区三区| 韩国欧美国产一区| 欧美一级国产精品| 国产精品一卡二卡在线观看| 2024国产精品| 成人激情图片网| 亚洲图片你懂的| 日韩免费看的电影| 久久精品国内一区二区三区| 久久精品一区四区| 首页亚洲欧美制服丝腿| 久久免费电影网| 一本一道久久a久久精品综合蜜臀| 亚洲精品v日韩精品| 日韩你懂的电影在线观看| 亚洲夂夂婷婷色拍ww47| 久久嫩草精品久久久精品一| 一本大道av伊人久久综合| 蜜臀av性久久久久蜜臀aⅴ四虎 | 亚洲欧美另类在线| 欧美成人免费网站| av爱爱亚洲一区|