婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲必備之XPath解析庫

Python爬蟲必備之XPath解析庫

熱門標簽:海外網吧地圖標注注冊 打電話機器人營銷 聊城語音外呼系統 騰訊地圖標注沒法顯示 商家地圖標注海報 孝感營銷電話機器人效果怎么樣 ai電銷機器人的優勢 南陽打電話機器人 地圖標注自己和別人標注區別

一、簡介

XPath 是一門在 XML 文檔中查找信息的語言。XPath 可用來在 XML 文檔中對元素和屬性進行遍歷。XPath 是 W3C XSLT 標準的主要元素,并且 XQuery 和 XPointer 都構建于 XPath 表達之上。

Xpath解析庫介紹:數據解析的過程中使用過正則表達式, 但正則表達式想要進準匹配難度較高, 一旦正則表達式書寫錯誤, 匹配的數據也會出錯。

網頁由三部分組成: HTML, Css, JavaScript, HTML頁面標簽存在層級關系, 即DOM樹, 在獲取目標數據時可以根據網頁層次關系定位標簽, 在獲取標簽的文本或屬性。

二、安裝

pip install lxml

三、節點

3.1 選取節點

XPath 使用路徑表達式在 XML 文檔中選取節點。節點是通過沿著路徑或者 step 來選取的。 下面列出了最有用的路徑表達式:

表達式 描述
nodename 選取此節點的所有子節點。
/ 從根節點選取。
// 從匹配選擇的當前節點選擇文檔中的節點,而不考慮它們的位置。
選取當前節點的父節點。
. 選取當前節點。
@ 選取屬性。

3.2 選取未知節點

XPath 通配符可用來選取未知的 XML 元素。

通配符 描述
* 匹配任何元素節點。
@* 匹配任何屬性節點。
node() 匹配任何類型的節點。

在下面的表格中,我們列出了一些路徑表達式,以及這些表達式的結果:

路徑表達式 結果
/bookstore/* 選取 bookstore 元素的所有子元素。
//* 選取文檔中的所有元素。
//title[@*] 選取所有帶有屬性的 title 元素。

3.3 節點關系

父(Parent)

每個元素以及屬性都有一個父。
在下面的例子中,book 元素是 title、author、year 以及 price 元素的父:

book>
  title>Harry Potter/title>
  author>J K. Rowling/author>
  year>2005/year>
  price>29.99/price>
/book>

子(Children)

元素節點可有零個、一個或多個子。
在下面的例子中,title、author、year 以及 price 元素都是 book 元素的子:

book>
  title>Harry Potter/title>
  author>J K. Rowling/author>
  year>2005/year>
  price>29.99/price>
/book>

同胞(Sibling)

擁有相同的父的節點
在下面的例子中,title、author、year 以及 price 元素都是同胞:

book>
  title>Harry Potter/title>
  author>J K. Rowling/author>
  year>2005/year>
  price>29.99/price>
/book>

先輩(Ancestor)

某節點的父、父的父,等等。
在下面的例子中,title 元素的先輩是 book 元素和 bookstore 元素:

bookstore>

book>
  title>Harry Potter/title>
  author>J K. Rowling/author>
  year>2005/year>
  price>29.99/price>
/book>

/bookstore>

后代(Descendant)

某個節點的子,子的子,等等。
在下面的例子中,bookstore 的后代是 book、title、author、year 以及 price 元素:

bookstore>

book>
  title>Harry Potter/title>
  author>J K. Rowling/author>
  year>2005/year>
  price>29.99/price>
/book>

/bookstore>

四、XPath實例

爬取糗事百科

import requests
# 導包
from lxml import etree
import os
base_url = 'https://www.qiushibaike.com/video/'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'
}
res = requests.get(url=base_url, headers=headers)
html = res.content.decode('utf-8')
# xpath解析
tree = etree.HTML(html)
# 標題
content = tree.xpath('//*/a/div[@class="content"]/span/text()')
# 視頻
video_list = tree.xpath('//*/video[@controls="controls"]/source/@src')
index = 0
for i in video_list:
    # 獲取視頻二進制流
    video_content = requests.get(url= 'https:' + i,headers=headers).content
    # 標題
    title_1 = content[0].strip('\n')
    # 將視頻二進制寫入文件
    with open(f'Video/{title_1}.mp4','wb') as f:
        f.write(video_content)
    index += 1

到此這篇關于Python爬蟲必備之XPath解析庫的文章就介紹到這了,更多相關XPath解析庫內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python數據XPath使用案例詳解
  • python網絡爬蟲精解之XPath的使用說明
  • python動態網站爬蟲實戰(requests+xpath+demjson+redis)
  • python使用xpath獲取頁面元素的使用
  • Python爬蟲之用Xpath獲取關鍵標簽實現自動評論蓋樓抽獎(二)
  • python數據解析之XPath詳解

標簽:聊城 楊凌 六盤水 揚州 牡丹江 南寧 迪慶 撫州

巨人網絡通訊聲明:本文標題《Python爬蟲必備之XPath解析庫》,本文關鍵詞  Python,爬蟲,必備,之,XPath,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲必備之XPath解析庫》相關的同類信息!
  • 本頁收集關于Python爬蟲必備之XPath解析庫的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    欧美成人精品二区三区99精品| 国产精品一区二区三区四区| 91麻豆国产自产在线观看| 婷婷综合久久一区二区三区| 欧美精品一区男女天堂| 欧美肥胖老妇做爰| 欧美色图12p| 在线亚洲免费视频| 一本到三区不卡视频| 99久久免费国产| 成人一区在线观看| 国产成+人+日韩+欧美+亚洲| 国产成人小视频| 国产一区二区三区视频在线播放| 日本成人中文字幕在线视频| 午夜一区二区三区在线观看| 一区二区三区在线视频免费| 亚洲激情图片一区| 一区二区三区在线视频免费观看 | 国产成人精品aa毛片| 国产一区二区三区久久悠悠色av| 久久国产生活片100| 青草av.久久免费一区| 日本三级韩国三级欧美三级| 免费不卡在线视频| 日韩电影在线看| 免费高清不卡av| 久久99精品久久久久久| 国产精品性做久久久久久| 国产一区久久久| 成人一区二区三区视频| 97久久超碰国产精品| 91福利在线免费观看| 欧美精品粉嫩高潮一区二区| 日韩午夜激情视频| 欧美大度的电影原声| 久久老女人爱爱| 国产精品久久久久婷婷| 一区二区三区资源| 日精品一区二区三区| 久久99深爱久久99精品| 高清不卡一区二区在线| 色综合久久88色综合天天6| 欧美日高清视频| 精品国产一区二区国模嫣然| 亚洲国产岛国毛片在线| 亚洲综合一区二区三区| 国产在线一区二区| 91天堂素人约啪| 91精品国产aⅴ一区二区| 久久精品男人的天堂| 亚洲伦理在线免费看| 免费人成精品欧美精品| 国产高清精品在线| 欧美日韩一本到| 国产亚洲精品中文字幕| 一区二区三区电影在线播| 蜜桃视频第一区免费观看| 高清日韩电视剧大全免费| 91福利社在线观看| 久久伊人蜜桃av一区二区| 亚洲欧美色综合| 黄色资源网久久资源365| 91麻豆精品视频| 久久伊人中文字幕| 午夜精品福利一区二区蜜股av | 91福利区一区二区三区| 久久一区二区视频| 亚洲精品一卡二卡| 国产美女视频一区| 91精品欧美久久久久久动漫 | 亚洲一级二级三级在线免费观看| 国内久久精品视频| 欧美三级在线看| 中文字幕的久久| 免费观看在线色综合| 色综合色狠狠综合色| 精品国产乱码久久久久久蜜臀| 亚洲欧美另类久久久精品2019| 美女久久久精品| 欧美色精品天天在线观看视频| 日本一区二区电影| 久久不见久久见中文字幕免费| 色狠狠一区二区三区香蕉| 国产午夜精品一区二区| 狠狠色丁香久久婷婷综合_中| 欧美偷拍一区二区| 亚洲伦理在线免费看| 成+人+亚洲+综合天堂| 久久久亚洲精华液精华液精华液 | 亚洲综合在线视频| 不卡一卡二卡三乱码免费网站| 久久综合色之久久综合| 免费不卡在线视频| 日韩精品一区二| 麻豆一区二区三| 精品区一区二区| 麻豆久久久久久| 欧美哺乳videos| 久久国产精品色婷婷| 欧美夫妻性生活| 午夜精品一区在线观看| 欧洲一区在线观看| 亚洲一级二级在线| 欧美日韩亚洲高清一区二区| 亚洲一区二区在线免费看| 欧美性生活大片视频| 亚洲第一成年网| 91精品国产一区二区三区| 蜜臀av性久久久久蜜臀aⅴ| 91精品中文字幕一区二区三区| 秋霞午夜鲁丝一区二区老狼| 8v天堂国产在线一区二区| 午夜成人免费视频| 日韩免费观看2025年上映的电影| 老司机精品视频线观看86| 精品久久久影院| 丁香天五香天堂综合| 中文字幕中文在线不卡住| 91蜜桃视频在线| 亚洲v中文字幕| 日韩精品一区二区三区在线观看| 激情深爱一区二区| 日本一区二区不卡视频| 色婷婷久久久久swag精品| 亚洲国产精品久久久久婷婷884 | 亚洲欧美自拍偷拍| 欧美性生交片4| 精品一区二区在线观看| 国产精品激情偷乱一区二区∴| 色爱区综合激月婷婷| 天堂资源在线中文精品| 欧美成va人片在线观看| 色综合天天综合网国产成人综合天| 亚洲国产精品久久一线不卡| 91精品国产全国免费观看| 国产精品12区| 亚洲女厕所小便bbb| 欧美人xxxx| 成人影视亚洲图片在线| 日本不卡视频一二三区| 日韩一区欧美小说| 欧美伦理视频网站| 国产精品一区二区视频| 亚洲欧美激情视频在线观看一区二区三区 | 久久国产生活片100| 国产精品久久久久久久久久免费看| 欧美日韩黄视频| 成a人片国产精品| 久久99国产精品久久99| 亚洲一区免费在线观看| 国产午夜精品一区二区三区四区 | 午夜电影一区二区三区| 国产精品二三区| 精品福利一区二区三区 | 日本高清不卡一区| 国产成人免费视| 日本在线观看不卡视频| 亚洲女人的天堂| 国产精品午夜久久| 日韩欧美国产综合| 欧美日韩午夜在线| 91在线视频免费91| 国产成人av资源| 另类小说一区二区三区| 石原莉奈在线亚洲三区| 亚洲国产综合人成综合网站| 国产精品免费网站在线观看| 久久久久久久久久电影| 日韩一区二区电影| 欧美日韩一区高清| 欧美亚洲综合一区| 日本久久电影网| 在线精品视频小说1| av网站一区二区三区| 国产91精品免费| 国产成人在线观看| 韩国女主播一区| 国产一区二区看久久| 国产一区中文字幕| 国产一区二区日韩精品| 韩国欧美国产一区| 国产成人综合自拍| 成a人片亚洲日本久久| 亚洲一区二区三区四区在线免费观看| 1区2区3区精品视频| 日韩欧美色电影| 2021中文字幕一区亚洲| 久久久精品日韩欧美| 国产精品全国免费观看高清| 亚洲欧洲av另类| 亚洲一线二线三线视频| 亚洲成人免费影院| 蜜臀av国产精品久久久久| 国产精品一二三四| av毛片久久久久**hd| 91无套直看片红桃| 91精品啪在线观看国产60岁| 久久综合av免费| 综合网在线视频|