婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python如何利用正則表達式爬取網頁信息及圖片

Python如何利用正則表達式爬取網頁信息及圖片

熱門標簽:地圖標注微信發送位置不顯示 地圖標注的意義點 上海機器人外呼系統哪家好 蓋州市地圖標注 地圖制圖標注位置改變是移位嗎 南京銷售外呼系統軟件 房產電銷外呼系統 浙江電銷卡外呼系統好用嗎 315電話機器人廣告

一、正則表達式是什么?

概念:

正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規則字符串”,這個“規則字符串”用來表達對字符串的一種過濾邏輯。

正則表達式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。

個人理解:

簡單來說就是使用正則表達式來寫一個過濾器來過濾了掉雜亂的無用的信息(eg:網頁源代碼…)從中來獲取自己想要的內容

二、實戰項目

1.爬取內容

獲取上海所有三甲醫院的名稱并保存到.txt文件中

2.訪問鏈接

上海三甲醫院網站 link:https://yyk.99.com.cn/sanjia/shanghai/

3.正則表達式書寫的靈感

進入網站查看本頁面的源代碼發現 :醫院的名稱都是放在一個

div class="province-box"> ...... /div>

盒子里我們只需要直接把這個盒子里面的數據過濾一下就行

正則表達式:

法一:

1.一級過濾 : 

   div class="province-box">(.*)div class="wrap-right">

開頭是:div class="province-box"> (.*)  結尾是:div class="wrap-right">

2.二級過濾:

 title="(.*[院心部])*)" 獲取title=" " 里面的信息

法二:

優化后一次性過濾:

 li>a href="/[^/].*/" rel="external nofollow" rel="external nofollow" target="_blank" title="(.*)">

貼圖片

開頭是:

結尾是:

4.項目源代碼

import requests
import re

url = "https://yyk.99.com.cn/sanjia/shanghai/"
# 模擬瀏覽器的訪問
headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:87.0) '
                        'Gecko/20100101 Firefox/87.0'}
res = requests.get(url,headers=headers)

if res.status_code == 200:
	#1.獲取網頁源代碼
    raw_text = res.text
    
    #2.正則表達式書寫:
    #2.2注意:正則表達式默認匹配的是一行  我們的源代碼是多行匹配的要加另一個參數 re.DOTALL
	#2.3正則法一:
		#re.findall() 返回的是lsit集合 一次過濾
    re_res = re.findall(r'div class="province-box">(.*)div class="wrap-right">', raw_text,re.DOTALL)
    	#re_res[0] 獲取下標是的數據    二次過濾
    res=re.findall(r'title="(.*[院心部])*)"',re_res[0])
    	#檢查打印獲取到的信息
	print(res)
	
	#2.4正則法二:
		#(優化)不用二次過濾 一次過濾就解決了
    # re_list = re.findall(r'li>a href="/[^/].*/" rel="external nofollow"  rel="external nofollow"  target="_blank" title="(.*)">', res.text)
    #print(re_list)

    # 寫入文件中
    read = open("上海醫院名單", "w", encoding='utf-8')
    for i in res:
        read.write(i)
        read.write("\n")
    read.close()
else:
    print("error")

項目目錄:

部分結果:

python 正則表達式-提取圖片地址

import os,sys,time,json,time
import socket,random,hashlib
import requests,configparser
import json,re
from datetime import datetime
from multiprocessing.dummy import Pool as ThreadPool


def getpicurl(url):
    url = "http://www.mzitu.com/zipai/comment-page-352"
    html = requests.get(url).text
    pic_url = re.findall('img src="(.*?)"',html,re.S)
    for key in pic_url:
        print(key + "\r\n")
    #print(pic_url)
    
getpicurl("http://www.mzitu.com/zipai/comment-pag.e-352")

輸出結果:

python mmm.py
http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsvu6578k1j20sg15nk4x.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu64q4lgj20j60nz0ua.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu67hhbaj20sg110toc.jpg

http://wx2.sinaimg.cn/mw1024/9d52c073gy1fsvu66bw56j20sg0zjtlr.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu65vvvtj20sg0mmtfc.jpg

http://wx2.sinaimg.cn/mw1024/9d52c073gy1fsvu66gtnzj20sg0zk48h.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu65q1qyj20sg11vtmo.jpg

http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsvu64wgejj20e60iwtax.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu66a8xfj20lt0rptgw.jpg

http://wx4.sinaimg.cn/mw1024/9d52c073gy1fsnr6n7n66j20k00ozn52.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsnr6njhjyj20sg0zkn88.jpg

http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsnr6n2zmyj20sg0ldten.jpg

總結

到此這篇關于Python如何利用正則表達式爬取網頁信息及圖片的文章就介紹到這了,更多相關Python正則表達式爬取內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python正則表達式中的量詞符號與組問題小結
  • Python正則表達式的應用詳解
  • 淺談Python中的正則表達式
  • python正則表達式re.search()的基本使用教程
  • python通過re正則表達式切割中英文的操作
  • Python驗證的50個常見正則表達式
  • python re模塊和正則表達式
  • Python中正則表達式對單個字符,多個字符和匹配邊界等使用
  • python正則表達式re.match()匹配多個字符方法的實現
  • 如何利用python正則表達式匹配版本信息
  • python使用正則表達式匹配txt特定字符串(有換行)
  • Python爬蟲教程之利用正則表達式匹配網頁內容
  • python中使用正則表達式將所有符合條件的字段全部提取出來
  • Python使用正則表達式實現爬蟲數據抽取
  • Python 通過正則表達式快速獲取電影的下載地址
  • python正則表達式 匹配反斜杠的操作方法
  • 帶你精通Python正則表達式

標簽:克拉瑪依 赤峰 雙鴨山 臨汾 陽泉 貴州 日照 金華

巨人網絡通訊聲明:本文標題《Python如何利用正則表達式爬取網頁信息及圖片》,本文關鍵詞  Python,如何,利用,正則,表達式,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python如何利用正則表達式爬取網頁信息及圖片》相關的同類信息!
  • 本頁收集關于Python如何利用正則表達式爬取網頁信息及圖片的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    亚洲视频精选在线| 国产乱人伦偷精品视频免下载| 免费精品视频在线| 色婷婷亚洲精品| 国产亚洲精品7777| 亚洲成人av一区二区三区| av一区二区久久| 中文字幕国产一区二区| 成人一级片在线观看| 欧美xxxx在线观看| 蜜臀av性久久久久av蜜臀妖精| 欧美三级电影一区| 亚洲国产综合视频在线观看| 99久久国产综合色|国产精品| 国产亚洲成av人在线观看导航| 久久99精品久久久久久动态图| 日韩午夜中文字幕| 国产一区二区三区在线观看免费| 欧美v日韩v国产v| 国内成人精品2018免费看| 久久亚洲精精品中文字幕早川悠里| 日本不卡视频在线观看| 久久久91精品国产一区二区三区| 国产精品 日产精品 欧美精品| 久久综合九色欧美综合狠狠| 国产成人自拍网| 亚洲成人av中文| 久久色在线视频| 播五月开心婷婷综合| 亚洲一区二区av在线| 日韩一区二区三区四区| 国产成人综合在线| 亚洲成人一区二区在线观看| 精品日韩av一区二区| 色综合久久99| 国产精品18久久久久久久久| 国产精品久久久久久一区二区三区| 91官网在线免费观看| 国产一区二区免费在线| 一区二区三区日韩在线观看| 久久久欧美精品sm网站| 欧美性生活影院| 91蜜桃网址入口| 国产精一区二区三区| 三级欧美在线一区| 亚洲综合久久久久| 中文字幕一区二区三区色视频| 精品久久久久一区二区国产| 色老综合老女人久久久| 成人av在线看| 懂色av一区二区在线播放| 国产毛片精品视频| 精品一区二区三区在线播放| 日韩电影在线免费| 亚洲www啪成人一区二区麻豆| 亚洲图片激情小说| 亚洲一线二线三线久久久| 亚洲婷婷国产精品电影人久久| 国产亚洲欧美日韩俺去了| 中文无字幕一区二区三区| 中文一区二区在线观看| 一区二区中文视频| 亚洲欧美激情在线| 亚洲丰满少妇videoshd| 亚洲国产精品久久艾草纯爱| 天天亚洲美女在线视频| 久久精品国产亚洲a| 国内外成人在线视频| 成人一区二区三区| 欧美体内she精视频| 91麻豆精品国产| 国产精品天美传媒沈樵| 亚洲欧美日韩国产中文在线| 亚洲欧美一区二区三区孕妇| 亚洲韩国精品一区| 国产麻豆精品在线| 欧美亚洲一区三区| 久久综合五月天婷婷伊人| 国产精品久久久久久久浪潮网站| 亚洲狼人国产精品| 国产原创一区二区| 91精品国产91久久久久久一区二区 | 成人免费毛片a| 欧美人狂配大交3d怪物一区| 久久精品欧美一区二区三区麻豆| 中文字幕在线观看不卡视频| 久久精品国产亚洲a| 色呦呦国产精品| 欧美成人午夜电影| 亚洲午夜电影网| 色综合久久久网| 国产精品日韩成人| 国产精品亚洲第一| 日韩久久久精品| 日韩经典中文字幕一区| 91老司机福利 在线| 久久久www成人免费无遮挡大片| 日韩精品一二三四| 色综合天天天天做夜夜夜夜做| 国产日韩欧美亚洲| 黄色精品一二区| 精品久久久久久综合日本欧美| 香蕉久久一区二区不卡无毒影院| 91麻豆精品视频| 亚洲色大成网站www久久九九| 9色porny自拍视频一区二区| 国产欧美日韩不卡免费| 国产高清久久久久| 最新国产精品久久精品| 91在线免费播放| 亚洲va天堂va国产va久| 欧美电影一区二区三区| 麻豆91精品视频| 国产视频在线观看一区二区三区| 丁香六月综合激情| 亚洲欧美国产毛片在线| 91超碰这里只有精品国产| 美女视频一区在线观看| 久久综合国产精品| 99re这里只有精品视频首页| 亚洲一区二区在线观看视频| 日韩精品一区二区三区老鸭窝| 国产福利一区二区三区视频在线 | 亚洲第一会所有码转帖| 日韩视频永久免费| av电影在线观看不卡| 亚洲综合成人在线视频| 久久综合成人精品亚洲另类欧美 | 国产在线精品国自产拍免费| 亚洲三级免费观看| 久久色.com| 欧美美女激情18p| 91色综合久久久久婷婷| 久久精品国产色蜜蜜麻豆| 亚洲欧美国产77777| 久久综合视频网| 欧美久久高跟鞋激| 一本一道综合狠狠老| 国产精品羞羞答答xxdd| 蜜桃av一区二区在线观看| 一区二区日韩电影| 亚洲同性gay激情无套| 欧美国产精品一区| 欧美sm美女调教| 欧美精品国产精品| 在线观看亚洲一区| www.日韩在线| 亚洲国产毛片aaaaa无费看 | 日韩电影在线看| 欧美成人在线直播| 中文字幕第一区| 欧美一二三区在线| 欧美欧美午夜aⅴ在线观看| 成人免费毛片a| 色综合色狠狠综合色| a亚洲天堂av| 色哟哟国产精品免费观看| 色婷婷香蕉在线一区二区| 色婷婷综合激情| 欧美日韩久久一区二区| 欧美一区二区三区在线| 日韩久久免费av| 国产精品少妇自拍| 欧美tickling网站挠脚心| 色综合天天综合在线视频| 欧美色图激情小说| 日韩免费看网站| 久久久久久久久久久电影| 国产午夜亚洲精品理论片色戒| 国产精品久久99| 亚洲一线二线三线视频| 欧美aⅴ一区二区三区视频| 久国产精品韩国三级视频| 99精品久久免费看蜜臀剧情介绍| 成人丝袜18视频在线观看| 欧美日韩高清不卡| 久久久久久久综合| 亚洲精品久久久蜜桃| 国产一区二区网址| 欧美日韩国产精选| 国产精品成人在线观看| 麻豆久久久久久| 欧美性感一类影片在线播放| 日韩欧美国产成人一区二区| 一区二区三区四区五区视频在线观看| 午夜精品久久一牛影视| 成av人片一区二区| 亚洲精品在线观看视频| 午夜免费欧美电影| 99久久er热在这里只有精品66| 91精品国产免费| 性久久久久久久久| 欧美综合一区二区| 亚洲综合色噜噜狠狠| 91影院在线免费观看| 亚洲欧洲精品一区二区三区不卡| 免费成人在线网站| 欧美一区二区三区四区视频 | 91精品国产综合久久婷婷香蕉| 亚洲第一狼人社区|