婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲之爬取某文庫文檔數據

Python爬蟲之爬取某文庫文檔數據

熱門標簽:房產電銷外呼系統 地圖標注微信發送位置不顯示 南京銷售外呼系統軟件 浙江電銷卡外呼系統好用嗎 蓋州市地圖標注 上海機器人外呼系統哪家好 315電話機器人廣告 地圖制圖標注位置改變是移位嗎 地圖標注的意義點

一、基本開發環境

Python 3.6

Pycharm

二、相關模塊的使用

import os
import requests
import time
import re
import json
from docx import Document
from docx.shared import Cm

安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。

三、目標網頁分析

網站的文檔內容,都是以圖片形式存在的。它有自己的數據接口

接口鏈接:

https://openapi.book118.com/getPreview.html?project_id=1aid=272112230t=f2c66902d6b63726d8e08b557fef90fbview_token=SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1page=1callback=jQuery18304186406662159248_1614492889385_=1614492889486

接口的請求參數

四、整體思路

  • 請求網頁返回response數據(字符串)
  • 通過re模塊匹配提取中間的數據(列表)索引取0(字符串)
  • 通過json模塊是把提取出來的數據轉換成json模塊
  • 通過遍歷獲取每張圖片的url地址
  • 保存圖片到本地文件夾
  • 把圖片保存到word文檔
  • 爬蟲代碼實現

五、爬蟲代碼實現

def download():
    content = 0
    for page in range(1, 96, 6):
        # 給定 2秒延時
        time.sleep(2)
        # 獲取時間戳
        now_time = int(time.time() * 1000)
        url = 'https://openapi.book118.com/getPreview.html'
        # 請求參數
        params = {
            'project_id': '1',
            'aid': '272112230',
            't': 'f2c66902d6b63726d8e08b557fef90fb',
            'view_token': 'SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1',
            'page': f'{page}',
            '_': now_time,
        }
        # 請求頭
        headers = {
            'Host': 'openapi.book118.com',
            'Referer': 'https://max.book118.com/html/2020/0427/8026036013002110.shtm',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
        }
        response = requests.get(url=url, params=params, headers=headers)
        # 使用正則表達式提取內容
        result = re.findall('jsonpReturn\((.*?)\)', response.text)[0]
        # 字符串轉json數據
        json_data = json.loads(result)['data']
        # 字典值的遍歷
        for value in json_data.values():
            content += 1
            # 拼接圖片url
            img_url = 'http:' + value
            print(img_url)
            headers_1 = {
                'Host': 'view-cache.book118.com',
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
            }
            # 請求圖片url地址 獲取content二進制數據
            img_content = requests.get(url=img_url, headers=headers_1).content
            # 文件名
            img_name = str(content) + '.jpg'
            # 保存路徑
            filename = 'img\\'
            # 以二進制方式保存 (圖片、音頻、視頻等文件都是以二進制的方式保存)
            with open(filename + img_name, mode='wb') as f:
                f.write(img_content)

注意點:

1、一定要給延時,不然后面接口數據會請求不到。

2、請求圖片url的時候headers參數需要寫完整,否則保存圖片是無法打開的

3、命名最好是給定數字,1.jpg、2.jpg 這樣,方便后續保存到word

爬蟲部分的代碼還是比較簡單的,沒有什么特別的難度。

爬取這些文檔,都是需要打印或者查詢所以要把這些單張的圖片都保存到word文檔里面。

六、寫入文檔

def save_picture():
    document = Document()
    path = './img/'
    lis = os.listdir(path)
    c = []
    for li in lis:
        index = li.replace('.jpg', '')
        c.append(index)
    c_1 = sorted(list(map(int, c)))
    print(c_1)
    new_files = [(str(i) + '.jpg') for i in c_1]
    for num in new_files:
        img_path = path + num
        document.add_picture(img_path, width=Cm(17), height=Cm(24))
        document.save('tu.doc')  # 保存文檔
        os.remove(img_path)  # 刪除保存在本地的圖片

到此這篇關于Python爬蟲之爬取某文庫文檔數據的文章就介紹到這了,更多相關python爬取文檔數據內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python爬取股票信息,并可視化數據的示例
  • Python爬取數據并實現可視化代碼解析
  • python如何爬取網站數據并進行數據可視化
  • 高考要來啦!用Python爬取歷年高考數據并分析
  • 單身狗福利?Python爬取某婚戀網征婚數據
  • Python爬蟲之自動爬取某車之家各車銷售數據
  • Python爬蟲之爬取2020女團選秀數據
  • python爬蟲之教你如何爬取地理數據
  • Python爬蟲實戰之爬取京東商品數據并實實現數據可視化

標簽:雙鴨山 貴州 陽泉 克拉瑪依 赤峰 臨汾 日照 金華

巨人網絡通訊聲明:本文標題《Python爬蟲之爬取某文庫文檔數據》,本文關鍵詞  Python,爬蟲,之爬,取某,文庫,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲之爬取某文庫文檔數據》相關的同類信息!
  • 本頁收集關于Python爬蟲之爬取某文庫文檔數據的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    51精品秘密在线观看| 蜜桃av一区二区三区电影| 亚洲免费在线看| 久久99久久99小草精品免视看| 久久久精品免费观看| 天天做天天摸天天爽国产一区 | 精品国产乱码久久| 久久精品久久久精品美女| 欧美群妇大交群的观看方式| 亚洲一级在线观看| 欧美日韩免费观看一区三区| 亚洲bt欧美bt精品777| 欧美在线一区二区| 亚洲成人精品影院| 欧美电视剧在线看免费| 99久久精品免费看国产免费软件| 中文字幕日本不卡| 色综合久久中文综合久久牛| 亚洲国产精品久久一线不卡| 4438x亚洲最大成人网| 精品一区二区三区av| 中文字幕一区二区三区在线观看| 91久久精品网| 国产自产高清不卡| 亚洲欧洲日韩在线| 91精品国产乱码久久蜜臀| 国产综合久久久久久鬼色| 最近日韩中文字幕| 日韩一区二区三区在线视频| 成人美女在线视频| 亚洲妇熟xx妇色黄| 久久天天做天天爱综合色| 久久国产精品99久久久久久老狼| 国产亚洲综合性久久久影院| 色婷婷国产精品| 婷婷中文字幕一区三区| 精品国产3级a| 一本久道久久综合中文字幕| 亚洲超丰满肉感bbw| 2020国产精品久久精品美国| 91麻豆视频网站| 美女被吸乳得到大胸91| 亚洲女女做受ⅹxx高潮| 欧美精品一区二区三区在线播放 | 欧美一区二区成人| 国产成人av电影在线| 亚洲电影激情视频网站| 国产精品欧美综合在线| 日韩一级在线观看| 色悠久久久久综合欧美99| 激情综合一区二区三区| 亚洲第一在线综合网站| 亚洲天堂av老司机| 久久久国产精华| 欧美一区中文字幕| 欧美在线一区二区三区| 99国内精品久久| 国产成人在线视频网站| 老司机精品视频在线| 亚洲视频综合在线| 国产日韩av一区二区| 欧美日本一区二区| 欧美系列日韩一区| 日本韩国一区二区三区| 成人网在线免费视频| 91精品国产色综合久久不卡蜜臀| 波多野结衣一区二区三区| 激情国产一区二区| 免费在线观看精品| 日韩激情一区二区| 日韩国产在线观看| 日韩精品电影在线观看| 亚洲国产乱码最新视频| 一区二区三区影院| 亚洲国产视频一区| 一区二区三区在线视频观看58| 亚洲女同ⅹxx女同tv| 一区二区三区欧美亚洲| 亚洲第一在线综合网站| 日本午夜一本久久久综合| 五月婷婷激情综合网| 免费看欧美女人艹b| 狠狠色综合日日| 国产91富婆露脸刺激对白| 本田岬高潮一区二区三区| 91麻豆国产福利在线观看| 欧美曰成人黄网| 日韩女优制服丝袜电影| 中文字幕国产一区| 亚洲少妇屁股交4| 亚洲亚洲人成综合网络| 日韩国产欧美视频| 精品一区二区久久久| 国产成人精品免费一区二区| 91蜜桃传媒精品久久久一区二区| 91久久精品一区二区| 欧美精品三级日韩久久| 国产午夜一区二区三区| 亚洲国产精品久久久久秋霞影院| 久色婷婷小香蕉久久| 午夜欧美电影在线观看| 激情综合亚洲精品| 国产a精品视频| 欧美这里有精品| 日韩欧美成人激情| 亚洲天堂精品视频| 久久久电影一区二区三区| 亚洲另类在线制服丝袜| 紧缚捆绑精品一区二区| 色综合天天性综合| 日韩精品一区二区三区蜜臀| 1024成人网| 国产一区视频导航| 欧美日韩一级二级三级| 国产精品美女久久久久久久久久久| 一区二区三区成人在线视频| 久久99精品久久久久久| 在线一区二区观看| 国产亚洲一二三区| 免费成人你懂的| 欧美少妇性性性| 国产精品欧美综合在线| 香蕉影视欧美成人| 色综合色综合色综合色综合色综合| 久久久久国产精品麻豆ai换脸| 国产精品第一页第二页第三页| 亚洲第一av色| 99久久免费国产| 欧美激情一区二区三区蜜桃视频| 免费高清成人在线| 91精品午夜视频| 日韩激情视频网站| 欧美精品 国产精品| 亚洲一区在线电影| 色哟哟在线观看一区二区三区| 国产精品福利一区| 99免费精品视频| 国产精品久久久久影视| 成人免费视频一区| 国产欧美一区二区精品忘忧草| 亚洲成人免费电影| 欧美在线观看视频在线| 中文字幕高清不卡| 精品写真视频在线观看| 欧美日韩激情一区二区| 亚洲最快最全在线视频| 色综合中文综合网| 青青草97国产精品免费观看无弹窗版| 欧美日韩中文字幕一区二区| 亚洲影院在线观看| 欧美日韩一区二区三区四区| 天天影视涩香欲综合网| 欧美欧美欧美欧美| 日韩一区精品字幕| 欧美成人猛片aaaaaaa| 国产乱码一区二区三区| 国产精品乱码一区二区三区软件| 国产成人在线影院| 亚洲精品成人悠悠色影视| 欧美日韩成人一区二区| 另类调教123区| 国产亚洲精品超碰| 色综合天天综合| 日韩有码一区二区三区| 欧美一区二区三区播放老司机| 秋霞成人午夜伦在线观看| 久久精品亚洲精品国产欧美kt∨| 麻豆精品一区二区三区| www日韩大片| www.欧美.com| 中文字幕在线不卡国产视频| caoporen国产精品视频| 亚洲成人午夜电影| 26uuu精品一区二区在线观看| 丁香另类激情小说| 午夜a成v人精品| 欧美第一区第二区| 99热这里都是精品| 亚洲v精品v日韩v欧美v专区| 精品三级av在线| av一区二区不卡| 美腿丝袜亚洲综合| 中文字幕欧美激情| 91九色最新地址| 国产精品原创巨作av| 亚洲欧美综合色| 91麻豆精品国产91久久久| 国产99一区视频免费| 美腿丝袜在线亚洲一区| 日韩一区在线看| 91精品国产色综合久久不卡蜜臀| 不卡电影一区二区三区| 久久精品久久精品| 午夜影院久久久| 日韩精品一区二| 欧美日韩免费观看一区二区三区| 成人性生交大片免费看视频在线 | 日韩欧美一级特黄在线播放| 99v久久综合狠狠综合久久| 美女国产一区二区三区|