婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲框架之Scrapy中Spider的用法

Python爬蟲框架之Scrapy中Spider的用法

熱門標簽:預覽式外呼系統 銀川電話機器人電話 電銷機器人錄音要學習什么 如何地圖標注公司 企業彩鈴地圖標注 煙臺電話外呼營銷系統 外賣地址有什么地圖標注 長春極信防封電銷卡批發 上海正規的外呼系統最新報價

Scrapy中Spider的用法

Spider類定義了如何爬取某個(或某些)網站。包括了爬取的動作(例如:是否跟進鏈接)以及如何從網頁的內容中提取結構化數據(爬取item)。換句話說,Spider就是您定義爬取的動作及分析某個網頁(或者是有些網頁)的地方。

對spider來說,爬取的循環類似下文:

1.以初始的URL初始化Request,并設置回調函數。當該request下載完畢并返回時,將生成response,并作為參數傳給該回調函數。spider中初始的request是通過調用start_requests()來獲取的。start_requests()讀取start_urls中的URL,并以parse為回調函數生成Request。

2.在回調函數內分析返回的(網頁)內容,返回ltem對象或者Request或者一個包括二者的可迭代容器。返回的Request對象之后會經過Scrapy處理,下載相應的內容,并調用設置的callback函數(函數可相同)。

3.在回調函數內,您可以使用選擇器(Selectors)(您也可以使用BeautifulSoup, Ixml或者您想用的任何解析器)來分析網頁內容,并根據分析的數據生成item。

4.最后,由spider返回的item將被存到數據庫(由某些ltem Pipeline處理)或使用Feed exports存入到文件中。

雖然該循環對任何類型的spider都(多少)適用,但Scrapy仍然為了不同的需求提供了多種默認spider。之后將討論這些spider。

Spider

scrapy.spider.Spider是最簡單的spider。每個其他的spider必須繼承自該類(包括Scrapy自帶的其他spider以及您自己編寫的spider)。其僅僅請求給定的start_urls / start_requests,并根據返回的結果(resulting responses)調用spider的 parse方法。

name

定義spider名字的字符串(string)。spider的名字定義了Scrapy如何定位(并初始化) spider,所以其必須是唯一的。不過您可以生成多個相同的spider實例(instance),這沒有任何限制。name是spider最重要的屬性,而且是必須的。

如果該spider爬取單個網站(single domain),一個常見的做法是以該網站(domain)(加或不加后綴)來命名spider。例如,如果spider爬取 mywebsite.com,該spider通常會被命名為mywebsite。

allowed_domains

可選。包含了spider允許爬取的域名(domain)列表(list)。當OffsiteMiddleware啟用時,域名不在列表中的URL不會被跟進。

start_urls

URL列表。當沒有制定特定的URL時,spider將從該列表中開始進行爬取。因此,第一個被獲取到的頁面的URL將是該列表之一。后續的URL將會從獲取到的數據中提取。

start_requests()

該方法必須返回一個可迭代對象(iterable)。該對象包含了spider用于爬取的第一個Request。

當spider啟動爬取并且未制定URL時,該方法被調用。當指定了URL時,make_requests_from_url()將被調用來創建Request對象。該方法僅僅會被Scrapy調用一次,因此您可以將其實現為生成器。

該方法的默認實現是使用start_urls的url生成Request。

如果您想要修改最初爬取某個網站的Request對象,您可以重寫(override)該方法。例如,如果您需要在啟動時以POST登錄某個網站,你可以這么寫:

def start_requests(self) :
    return [scrapy.FormRequest("http : / /ww. example.com/login",
        formdata={ 'user' : 'john', ' pass ' : 'secret'},
        ca77back=se1f.1ogged_in)]
 
def logged_in(self,response) :
## here you would extract links to follow and return Requests for
## each of them,with another ca77back
pass

parse

當response沒有指定回調函數時,該方法是Scrapy處理下載的response的默認方法。

parse負責處理response并返回處理的數據以及(/或)跟進的URL。Spider對其他的Request的回調函數也有相同的要求。

該方法及其他的Request回調函數必須返回一個包含Request 及(或) ltem的可迭代的對象。

參數: response-用于分析的response

啟動方式

start_urls

start_urls是一個列表

start_requests

使用start_requests()重寫start_ur1s,要使用Request()方法自己發送請求:

def start_requests(se7f):
    """重寫start_urls 規則"""
    yield scrapy.Request(ur1='http://quotes.toscrape.com/page/1/'cal1back=self.parse)

scrapy.Request

scrapy.Request是一個請求對象,創建時必須制定回調函數。

數據保存

可以使用-o將數據保存為常見的格式(根據后綴名保存)
支持的格式有下面幾種:

  • json
  • jsonlines
  • jl
  • csv
  • xml
  • marshal
  • pickle

使用方式:

scrapy crawl quotes2 -o a.json

案例: Spider樣例

##一*- coding: utf-8 -*-
 
import scrapy
 
clTass Quotes2spider(scrapy.spider):
    name = 'quotes2'
    a7lowed_domains = [ 'toscrape.com ' ]
    start_urls = [ ' http: //quotes.toscrape.com/ page/2/ ']
 
    def parse(self,response):
        quotes = response.css('.quote ' )
        for quote in quotes:
            text = quote.css( '.text: : text ' ).extract_first()
            auth = quote.css( '.author : :text ').extract_first()
            tages = quote.css('.tags a: :text' ).extract()
            yield dict(text=text , auth=auth, tages=tages)

到此這篇關于Python爬蟲框架之Scrapy中Spider的用法的文章就介紹到這了,更多相關Spider的用法內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 上手簡單,功能強大的Python爬蟲框架——feapder
  • python爬蟲框架feapder的使用簡介
  • Python爬蟲框架-scrapy的使用
  • 一文讀懂python Scrapy爬蟲框架
  • python Scrapy爬蟲框架的使用
  • 詳解Python的爬蟲框架 Scrapy
  • python3 Scrapy爬蟲框架ip代理配置的方法
  • Python使用Scrapy爬蟲框架全站爬取圖片并保存本地的實現代碼
  • Python爬蟲框架Scrapy實例代碼
  • Python之Scrapy爬蟲框架安裝及簡單使用詳解
  • 爬蟲框架 Feapder 和 Scrapy 的對比分析

標簽:西寧 湖北 潮州 盤錦 佳木斯 宜昌 上饒 珠海

巨人網絡通訊聲明:本文標題《Python爬蟲框架之Scrapy中Spider的用法》,本文關鍵詞  Python,爬蟲,框架,之,Scrapy,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲框架之Scrapy中Spider的用法》相關的同類信息!
  • 本頁收集關于Python爬蟲框架之Scrapy中Spider的用法的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    风间由美一区二区av101| 亚洲女爱视频在线| 精品国产乱码久久久久久蜜臀 | 成人午夜在线视频| 久久久久久日产精品| 国产精品亚洲综合一区在线观看| 精品国一区二区三区| 国产精品一区二区三区99| 国产清纯白嫩初高生在线观看91| 另类专区欧美蜜桃臀第一页| 精品粉嫩aⅴ一区二区三区四区| 久久精品国产亚洲高清剧情介绍 | 激情五月婷婷综合网| 在线亚洲+欧美+日本专区| 国产精品色在线观看| 91猫先生在线| 日韩黄色片在线观看| 日韩欧美卡一卡二| 美女一区二区三区| 精品剧情v国产在线观看在线| 三级在线观看一区二区| 欧美亚洲综合在线| 亚洲午夜激情av| 欧美综合在线视频| 一区二区三区毛片| 在线观看免费一区| 亚洲va欧美va天堂v国产综合| 一区二区三区精密机械公司| 国产ts人妖一区二区| 欧美日韩亚洲国产综合| 亚洲乱码国产乱码精品精小说| 一区二区三区四区在线| 中文字幕在线不卡一区二区三区| 欧美男人的天堂一二区| 五月激情综合婷婷| 在线不卡免费av| 黄色日韩网站视频| 国产精品久久久久久久久搜平片| 成人性视频免费网站| 亚洲视频香蕉人妖| 欧美老女人第四色| 久久国产精品99久久人人澡| 欧美日韩一级二级| 亚洲欧美怡红院| 成人免费精品视频| 日韩精品欧美精品| 国产亚洲精品精华液| 色天使久久综合网天天| 日韩二区三区四区| 久久综合色天天久久综合图片| 国产成人精品免费网站| 1024国产精品| 精品久久国产字幕高潮| 91在线精品一区二区三区| 一区二区三区欧美| 欧美精品一区二区三区蜜桃| 成人丝袜高跟foot| 天天操天天色综合| 国产精品国产精品国产专区不片| 欧洲在线/亚洲| 国产ts人妖一区二区| 亚洲青青青在线视频| 大胆欧美人体老妇| 亚洲码国产岛国毛片在线| 91精品欧美久久久久久动漫| 另类中文字幕网| 亚洲精品乱码久久久久久久久| 欧美日韩aaaaaa| 成人黄色av电影| 人人精品人人爱| 亚洲精品老司机| 国产精品嫩草影院av蜜臀| 欧美一级二级在线观看| 99久久综合99久久综合网站| 另类小说视频一区二区| 亚洲午夜免费电影| 日韩欧美色电影| 91麻豆精品91久久久久同性| 色综合久久综合网97色综合 | 一区二区三区四区在线播放 | 欧美无砖专区一中文字| 国产成人啪免费观看软件| 日韩中文欧美在线| 亚洲精品成a人| 亚洲精品成人在线| 亚洲精品写真福利| 亚洲精品综合在线| 亚洲美女免费视频| 亚洲午夜免费电影| 午夜精品一区二区三区电影天堂| 国产精品久久久久四虎| 日本一区二区三区四区在线视频| 欧美日韩精品一区二区在线播放| 国产成人福利片| 自拍视频在线观看一区二区| 精品国产髙清在线看国产毛片| youjizz久久| 久久99久久99精品免视看婷婷| 蜜臀久久久久久久| 午夜精品久久久久久久久久| 五月激情综合网| 麻豆中文一区二区| 日韩不卡手机在线v区| 五月激情六月综合| 久久99蜜桃精品| 国产一区二区三区高清播放| 国产精品一区二区不卡| 成人免费黄色在线| 欧美影院一区二区| 欧美精品久久久久久久多人混战| 欧美一区二区视频在线观看2020| 不卡一二三区首页| 国产专区综合网| 成人高清视频在线观看| 91碰在线视频| 91精品国产高清一区二区三区 | 91麻豆精品国产自产在线| 日韩午夜中文字幕| 国产欧美一区二区精品性色| 中文字幕亚洲成人| 亚洲bt欧美bt精品| 国产盗摄一区二区| 在线国产电影不卡| 精品久久久久久久久久久院品网| 国产精品久久看| 亚洲成av人片一区二区三区| 久久成人精品无人区| 不卡欧美aaaaa| 在线观看av一区二区| 精品美女一区二区| 亚洲一区二区三区四区五区黄| 久久电影网站中文字幕| 在线观看日韩av先锋影音电影院| 日韩欧美你懂的| 亚洲欧美日本在线| 韩国一区二区在线观看| 一本色道久久综合亚洲91| 日韩欧美在线影院| 一区二区三区在线影院| 国产精品一区二区久久精品爱涩| 欧美日韩三级在线| ...av二区三区久久精品| 九九精品视频在线看| 欧美色网一区二区| 亚洲欧洲日产国码二区| 国产在线一区观看| 欧美理论电影在线| 精品日韩99亚洲| 亚洲精品国产一区二区精华液| 国产最新精品免费| 在线成人av影院| 亚洲欧美怡红院| 国模冰冰炮一区二区| 欧美精品一区视频| 亚洲欧美电影院| 国产成人啪午夜精品网站男同| 日韩欧美国产成人一区二区| 亚洲综合精品自拍| 色综合天天综合| 日韩精品一区二区三区中文精品| 亚洲va韩国va欧美va| 国产精品综合视频| 亚洲三级在线免费| 丰满岳乱妇一区二区三区 | 成人理论电影网| 欧美国产一区视频在线观看| 国产suv精品一区二区三区| 欧美sm极限捆绑bd| 日韩**一区毛片| 欧美系列在线观看| 亚洲图片欧美激情| 色婷婷综合视频在线观看| 一区二区三区四区视频精品免费| 91在线观看免费视频| 亚洲桃色在线一区| 久久一区二区三区国产精品| 国产精品系列在线播放| 国产网红主播福利一区二区| 国产精品性做久久久久久| 国产日韩欧美麻豆| av中文一区二区三区| 一区二区三区不卡在线观看| 欧美日韩在线不卡| 久久精品欧美日韩精品| 欧美日韩国产一区| 韩国女主播一区二区三区| 国产精品欧美久久久久一区二区| 色婷婷综合久久久| 免费高清在线视频一区·| 欧美精品视频www在线观看| 久久精品国产在热久久| 国产欧美日韩在线观看| 一本色道综合亚洲| 美女高潮久久久| 国产精品国产精品国产专区不蜜 | 午夜久久久影院| 精品国产伦一区二区三区免费| 欧洲国内综合视频| 国产麻豆视频一区| 久久精品国内一区二区三区|