婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python如何利用正則表達式爬取網頁信息及圖片

Python如何利用正則表達式爬取網頁信息及圖片

熱門標簽:地圖標注微信發送位置不顯示 地圖標注的意義點 上海機器人外呼系統哪家好 蓋州市地圖標注 地圖制圖標注位置改變是移位嗎 南京銷售外呼系統軟件 房產電銷外呼系統 浙江電銷卡外呼系統好用嗎 315電話機器人廣告

一、正則表達式是什么?

概念:

正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規則字符串”,這個“規則字符串”用來表達對字符串的一種過濾邏輯。

正則表達式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。

個人理解:

簡單來說就是使用正則表達式來寫一個過濾器來過濾了掉雜亂的無用的信息(eg:網頁源代碼…)從中來獲取自己想要的內容

二、實戰項目

1.爬取內容

獲取上海所有三甲醫院的名稱并保存到.txt文件中

2.訪問鏈接

上海三甲醫院網站 link:https://yyk.99.com.cn/sanjia/shanghai/

3.正則表達式書寫的靈感

進入網站查看本頁面的源代碼發現 :醫院的名稱都是放在一個

div class="province-box"> ...... /div>

盒子里我們只需要直接把這個盒子里面的數據過濾一下就行

正則表達式:

法一:

1.一級過濾 : 

   div class="province-box">(.*)div class="wrap-right">

開頭是:div class="province-box"> (.*)  結尾是:div class="wrap-right">

2.二級過濾:

 title="(.*[院心部])*)" 獲取title=" " 里面的信息

法二:

優化后一次性過濾:

 li>a href="/[^/].*/" rel="external nofollow" rel="external nofollow" target="_blank" title="(.*)">

貼圖片

開頭是:

結尾是:

4.項目源代碼

import requests
import re

url = "https://yyk.99.com.cn/sanjia/shanghai/"
# 模擬瀏覽器的訪問
headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:87.0) '
                        'Gecko/20100101 Firefox/87.0'}
res = requests.get(url,headers=headers)

if res.status_code == 200:
	#1.獲取網頁源代碼
    raw_text = res.text
    
    #2.正則表達式書寫:
    #2.2注意:正則表達式默認匹配的是一行  我們的源代碼是多行匹配的要加另一個參數 re.DOTALL
	#2.3正則法一:
		#re.findall() 返回的是lsit集合 一次過濾
    re_res = re.findall(r'div class="province-box">(.*)div class="wrap-right">', raw_text,re.DOTALL)
    	#re_res[0] 獲取下標是的數據    二次過濾
    res=re.findall(r'title="(.*[院心部])*)"',re_res[0])
    	#檢查打印獲取到的信息
	print(res)
	
	#2.4正則法二:
		#(優化)不用二次過濾 一次過濾就解決了
    # re_list = re.findall(r'li>a href="/[^/].*/" rel="external nofollow"  rel="external nofollow"  target="_blank" title="(.*)">', res.text)
    #print(re_list)

    # 寫入文件中
    read = open("上海醫院名單", "w", encoding='utf-8')
    for i in res:
        read.write(i)
        read.write("\n")
    read.close()
else:
    print("error")

項目目錄:

部分結果:

python 正則表達式-提取圖片地址

import os,sys,time,json,time
import socket,random,hashlib
import requests,configparser
import json,re
from datetime import datetime
from multiprocessing.dummy import Pool as ThreadPool


def getpicurl(url):
    url = "http://www.mzitu.com/zipai/comment-page-352"
    html = requests.get(url).text
    pic_url = re.findall('img src="(.*?)"',html,re.S)
    for key in pic_url:
        print(key + "\r\n")
    #print(pic_url)
    
getpicurl("http://www.mzitu.com/zipai/comment-pag.e-352")

輸出結果:

python mmm.py
http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsvu6578k1j20sg15nk4x.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu64q4lgj20j60nz0ua.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu67hhbaj20sg110toc.jpg

http://wx2.sinaimg.cn/mw1024/9d52c073gy1fsvu66bw56j20sg0zjtlr.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu65vvvtj20sg0mmtfc.jpg

http://wx2.sinaimg.cn/mw1024/9d52c073gy1fsvu66gtnzj20sg0zk48h.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu65q1qyj20sg11vtmo.jpg

http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsvu64wgejj20e60iwtax.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu66a8xfj20lt0rptgw.jpg

http://wx4.sinaimg.cn/mw1024/9d52c073gy1fsnr6n7n66j20k00ozn52.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsnr6njhjyj20sg0zkn88.jpg

http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsnr6n2zmyj20sg0ldten.jpg

總結

到此這篇關于Python如何利用正則表達式爬取網頁信息及圖片的文章就介紹到這了,更多相關Python正則表達式爬取內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python正則表達式中的量詞符號與組問題小結
  • Python正則表達式的應用詳解
  • 淺談Python中的正則表達式
  • python正則表達式re.search()的基本使用教程
  • python通過re正則表達式切割中英文的操作
  • Python驗證的50個常見正則表達式
  • python re模塊和正則表達式
  • Python中正則表達式對單個字符,多個字符和匹配邊界等使用
  • python正則表達式re.match()匹配多個字符方法的實現
  • 如何利用python正則表達式匹配版本信息
  • python使用正則表達式匹配txt特定字符串(有換行)
  • Python爬蟲教程之利用正則表達式匹配網頁內容
  • python中使用正則表達式將所有符合條件的字段全部提取出來
  • Python使用正則表達式實現爬蟲數據抽取
  • Python 通過正則表達式快速獲取電影的下載地址
  • python正則表達式 匹配反斜杠的操作方法
  • 帶你精通Python正則表達式

標簽:克拉瑪依 赤峰 雙鴨山 臨汾 陽泉 貴州 日照 金華

巨人網絡通訊聲明:本文標題《Python如何利用正則表達式爬取網頁信息及圖片》,本文關鍵詞  Python,如何,利用,正則,表達式,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python如何利用正則表達式爬取網頁信息及圖片》相關的同類信息!
  • 本頁收集關于Python如何利用正則表達式爬取網頁信息及圖片的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    成人黄色一级视频| 亚洲一区二区三区在线看| 久久99国产精品久久| av亚洲产国偷v产偷v自拍| 日韩三级视频在线看| 亚洲最色的网站| 欧美日韩高清一区二区| 精彩视频一区二区三区| 久久精品网站免费观看| 婷婷综合五月天| 国产午夜精品一区二区三区视频 | 色婷婷久久综合| 最新久久zyz资源站| 91偷拍与自偷拍精品| 亚洲成人自拍一区| 国产欧美日韩精品一区| 色欧美片视频在线观看在线视频| 三级在线观看一区二区| 久久久不卡影院| 成人午夜免费视频| 国产精品久久精品日日| 中文字幕中文在线不卡住| 一区二区三区免费| 蜜芽一区二区三区| 91性感美女视频| 日韩精品中文字幕一区二区三区 | 五月激情丁香一区二区三区| 日韩和欧美的一区| 波多野结衣中文字幕一区| 欧美色综合久久| 自拍av一区二区三区| 日韩精品一二区| 国产成人精品免费在线| 在线观看不卡视频| 久久久国际精品| 日本欧美一区二区三区乱码 | 欧美国产精品中文字幕| 精品无人码麻豆乱码1区2区| 欧美肥妇bbw| 国产三区在线成人av| 日韩精品一卡二卡三卡四卡无卡| 国产一区二区三区精品视频| 欧美色图12p| 一区二区激情小说| 97aⅴ精品视频一二三区| 国产亚洲一二三区| 国产成人自拍网| 中文子幕无线码一区tr| 成人h动漫精品一区二| 中文一区在线播放| 91美女片黄在线观看91美女| 国产精品色在线观看| 成人午夜电影久久影院| 中文字幕中文字幕在线一区 | 最新热久久免费视频| 老司机精品视频在线| 日韩视频在线观看一区二区| 亚洲成人精品影院| 91视频国产资源| 国产精品色噜噜| 亚洲一卡二卡三卡四卡| 欧美在线观看禁18| 亚洲欧美偷拍卡通变态| 久久国产尿小便嘘嘘尿| 日韩一区二区三区av| 日日欢夜夜爽一区| 久久久久久免费网| 国产自产v一区二区三区c| 欧美偷拍一区二区| 美女视频黄免费的久久 | 国产成人亚洲综合a∨猫咪| 国产精品蜜臀av| 欧美大片一区二区| 色网综合在线观看| 国模一区二区三区白浆| 亚洲成人免费av| 亚洲人成网站影音先锋播放| 日韩精品中文字幕在线一区| 99精品视频在线观看| 国产一区二区免费在线| 日本免费新一区视频| 亚洲国产一区在线观看| 亚洲综合色噜噜狠狠| 综合精品久久久| 欧美经典一区二区| 国产欧美精品国产国产专区| 日韩欧美区一区二| 欧美成人乱码一区二区三区| 日韩欧美中文字幕制服| 日韩午夜中文字幕| 欧美一区二区性放荡片| 91精品国产91久久久久久一区二区| 91社区在线播放| 欧美日韩夫妻久久| 91精品婷婷国产综合久久| 91精品欧美一区二区三区综合在 | 欧美日韩国产一区| 在线不卡中文字幕| 久久综合一区二区| 精品日韩在线观看| 国产精品天干天干在线综合| 国产精品高潮呻吟| 亚洲mv在线观看| 精品一区二区三区免费播放| 国产91丝袜在线18| 91激情五月电影| 久久精品这里都是精品| 亚洲午夜久久久久久久久久久| 天天av天天翘天天综合网| 麻豆91在线观看| 欧美三级日韩三级| 亚洲丝袜精品丝袜在线| 精品一区二区三区久久| 69久久夜色精品国产69蝌蚪网| 国产精品乱码人人做人人爱| 免费欧美在线视频| 欧美一区二区成人| 亚洲第一狼人社区| 91亚洲精品一区二区乱码| 久久亚洲一级片| 国模少妇一区二区三区| 欧美一级午夜免费电影| 亚洲一级片在线观看| 97久久超碰国产精品| 国产精品国产三级国产aⅴ原创| 美腿丝袜在线亚洲一区| 日韩午夜在线影院| 久久国产精品无码网站| 日韩亚洲电影在线| 亚洲第一会所有码转帖| 91精品国产福利| 欧美a级一区二区| 日韩免费看的电影| 国产一区亚洲一区| 久久久91精品国产一区二区三区| 老司机精品视频在线| 国产亚洲综合性久久久影院| 99re8在线精品视频免费播放| 亚洲国产综合在线| 久久亚洲一级片| 色综合久久久久综合99| 99视频精品在线| 久久久国产精品午夜一区ai换脸| 国产精品女人毛片| 日韩一区二区三区电影在线观看 | 国产大陆a不卡| 亚洲欧洲日产国码二区| 日本韩国一区二区| 国产福利视频一区二区三区| 欧美久久久影院| 国产中文字幕精品| 亚洲777理论| 亚洲精品五月天| 欧美成人精品1314www| 色综合久久综合| 在线中文字幕一区二区| 亚洲激情图片一区| 国产乱对白刺激视频不卡| 欧美性受xxxx黑人xyx| 久久精品免费观看| 日韩在线观看一区二区| 亚洲乱码精品一二三四区日韩在线| 国产人成亚洲第一网站在线播放 | 亚洲男人的天堂网| www激情久久| 日韩午夜三级在线| 91精品国产综合久久精品| 在线观看日韩国产| 在线亚洲精品福利网址导航| 日韩精品一区二区三区在线观看| 成人av一区二区三区| 成人黄色大片在线观看| 91蜜桃免费观看视频| 7777精品伊人久久久大香线蕉经典版下载 | 午夜影院在线观看欧美| 麻豆精品在线视频| 国产在线乱码一区二区三区| 丁香亚洲综合激情啪啪综合| 色噜噜狠狠色综合中国| 欧美日韩国产美| 国产欧美精品一区二区三区四区| 亚洲国产精品传媒在线观看| 97se亚洲国产综合自在线观| 国产精品热久久久久夜色精品三区| 91麻豆swag| 91老师片黄在线观看| 精品国产亚洲一区二区三区在线观看| 欧美精品 国产精品| 国产精品午夜春色av| 丝袜脚交一区二区| 99精品视频中文字幕| 精品日产卡一卡二卡麻豆| 亚洲成人精品影院| 色国产精品一区在线观看| 2021中文字幕一区亚洲| 日韩av电影免费观看高清完整版在线观看| 国产丶欧美丶日本不卡视频| 日韩欧美一二区| 亚洲va中文字幕| 欧美mv和日韩mv国产网站|