婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲入門教程02之筆趣閣小說爬取

Python爬蟲入門教程02之筆趣閣小說爬取

熱門標簽:萬利達百貨商場地圖標注 熱門電銷機器人 上海企業外呼系統 電話機器人哪里有賣 okcc外呼系統怎么調速度 智能機器人電銷神器 河南虛擬外呼系統公司 惠州龍門400電話要怎么申請 外呼電信系統

前言

本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理。

前文

01、python爬蟲入門教程01:豆瓣Top電影爬取

基本開發環境

  • Python 3.6
  • Pycharm

相關模塊的使用

  • request
  • sparsel

安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。

單章爬取

一、明確需求

爬取小說內容保存到本地

  • 小說名字
  • 小說章節名字
  • 小說內容
# 第一章小說url地址
url = 'http://www.biquges.com/52_52642/25585323.html'
url = 'http://www.biquges.com/52_52642/25585323.html'
headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
print(response.text)

請求網頁返回的數據中出現了亂碼,這就需要我們轉碼了。

加一行代碼自動轉碼。

response.encoding = response.apparent_encoding

三、解析數據

根據css選擇器可以直接提取小說標題以及小說內容。

def get_one_novel(html_url):
 # 調用請求網頁數據函數
 response = get_response(html_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 獲取小說標題
 title = selector.css('.bookname h1::text').get()
 # 獲取小說內容 返回的是list
 content_list = selector.css('#content::text').getall()
 # ''.join(列表) 把列表轉換成字符串
 content_str = ''.join(content_list)
 print(title, content_str)

if __name__ == '__main__':
 url = 'http://www.biquges.com/52_52642/25585323.html'
 get_one_novel(url)

四、保存數據(數據持久化)

使用常用的保存方式: with open

def save(title, content):
 """
 保存小說
 :param title: 小說章節標題
 :param content: 小說內容
 :return: 
 """
 # 路徑
 filename = f'{title}\\'
 # os 內置模塊,自動創建文件夾
 if os.makedirs(filename):
 os.mkdir()
 # 一定要記得加后綴 .txt mode 保存方式 a 是追加保存 encoding 保存編碼
 with open(filename + title + '.txt', mode='a', encoding='utf-8') as f:
 # 寫入標題
 f.write(title)
 # 換行
 f.write('\n')
 # 寫入小說內容
 f.write(content)


保存一章小說,就這樣寫完了,如果想要保存整本小說呢?

整本小說爬蟲

既然爬取單章小說知道怎么爬取了,那么只需要獲取小說所有單章小說的url地址,就可以爬取全部小說內容了。

所有的單章的url地址都在 dd 標簽當中,但是這個url地址是不完整的,所以爬取下來的時候,要拼接url地址。

def get_all_url(html_url):
 # 調用請求網頁數據函數
 response = get_response(html_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 所有的url地址都在 a 標簽里面的 href 屬性中 
 dds = selector.css('#list dd a::attr(href)').getall()
 for dd in dds:
 novel_url = 'http://www.biquges.com' + dd
 print(novel_url)


if __name__ == '__main__':
 url = 'http://www.biquges.com/52_52642/index.html'
 get_all_url(url)

這樣就獲取了所有的小說章節url地址了。

爬取全本完整代碼

import requests
import parsel
from tqdm import tqdm


def get_response(html_url):
 headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
 }
 response = requests.get(url=html_url, headers=headers)
 response.encoding = response.apparent_encoding
 return response


def save(novel_name, title, content):
 """
 保存小說
 :param title: 小說章節標題
 :param content: 小說內容
 :return:
 """
 filename = f'{novel_name}' + '.txt'
 # 一定要記得加后綴 .txt mode 保存方式 a 是追加保存 encoding 保存編碼
 with open(filename, mode='a', encoding='utf-8') as f:
 # 寫入標題
 f.write(title)
 # 換行
 f.write('\n')
 # 寫入小說內容
 f.write(content)


def get_one_novel(name, novel_url):
 # 調用請求網頁數據函數
 response = get_response(novel_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 獲取小說標題
 title = selector.css('.bookname h1::text').get()
 # 獲取小說內容 返回的是list
 content_list = selector.css('#content::text').getall()
 # ''.join(列表) 把列表轉換成字符串
 content_str = ''.join(content_list)
 save(name, title, content_str)


def get_all_url(html_url):
 # 調用請求網頁數據函數
 response = get_response(html_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 所有的url地址都在 a 標簽里面的 href 屬性中
 dds = selector.css('#list dd a::attr(href)').getall()
 # 小說名字
 novel_name = selector.css('#info h1::text').get()
 for dd in tqdm(dds):
 novel_url = 'http://www.biquges.com' + dd
 get_one_novel(novel_name, novel_url)

if __name__ == '__main__':
 novel_id = input('輸入書名ID:')
 url = f'http://www.biquges.com/{novel_id}/index.html'
 get_all_url(url)


到此這篇關于Python爬蟲入門教程02之筆趣閣小說爬取的文章就介紹到這了,更多相關Python爬蟲筆趣閣小說爬取內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python 爬取國內小說網站
  • python 爬取小說并下載的示例
  • python爬取”頂點小說網“《純陽劍尊》的示例代碼
  • Python爬取365好書中小說代碼實例
  • Python實現的爬取小說爬蟲功能示例
  • Python scrapy爬取起點中文網小說榜單
  • python爬蟲之爬取筆趣閣小說升級版

標簽:淮安 周口 秦皇島 周口 綏化 百色 合肥 綿陽

巨人網絡通訊聲明:本文標題《Python爬蟲入門教程02之筆趣閣小說爬取》,本文關鍵詞  Python,爬蟲,入門教程,之筆,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲入門教程02之筆趣閣小說爬取》相關的同類信息!
  • 本頁收集關于Python爬蟲入門教程02之筆趣閣小說爬取的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    成人精品在线视频观看| 九九精品视频在线看| 日韩欧美在线影院| 欧美日韩国产小视频| 欧美亚日韩国产aⅴ精品中极品| 成人一区二区三区视频在线观看| 国产一区二区久久| 激情都市一区二区| 国产一区二区三区国产| 激情av综合网| 成人h动漫精品一区二区 | 成a人片亚洲日本久久| 国产精品亚洲专一区二区三区 | 91黄视频在线| 欧美私模裸体表演在线观看| 精品视频1区2区| 欧美一区二区在线免费播放| 91麻豆精品国产91久久久久| 欧美成人免费网站| 欧美国产欧美综合| 亚洲免费在线观看| 婷婷中文字幕综合| 精品夜夜嗨av一区二区三区| 国产99久久久精品| 欧美最猛性xxxxx直播| 91精品国产91久久综合桃花| 国产午夜精品理论片a级大结局| 国产精品午夜春色av| 亚洲午夜精品在线| 精彩视频一区二区| 一本色道综合亚洲| 欧美不卡一区二区三区| 国产精品乱码人人做人人爱| 亚洲综合一区二区三区| 久久国产欧美日韩精品| 99国产一区二区三精品乱码| 欧美精品一二三| 精品国产乱码91久久久久久网站| 国产欧美日韩另类视频免费观看 | 免费在线观看日韩欧美| 国产精品一级片| 欧美精品久久一区二区三区| 国产欧美一区视频| 首页国产丝袜综合| 99国产麻豆精品| 久久色中文字幕| 性久久久久久久久| 91在线精品一区二区三区| 91精品国产麻豆| 一区二区免费在线播放| 国产成人免费视频网站| 欧美日本一区二区在线观看| 国产精品福利一区二区| 久久99精品国产.久久久久| 91伊人久久大香线蕉| 精品国产乱码久久久久久免费 | 亚洲日本丝袜连裤袜办公室| 久久国产精品免费| 欧美日韩精品电影| 亚洲欧美在线视频| 成人午夜av电影| 2020国产精品自拍| 美女一区二区在线观看| 欧美嫩在线观看| 亚洲免费观看高清完整版在线观看| 国产精品一区二区在线看| 欧美一卡2卡三卡4卡5免费| 亚洲国产成人91porn| 91久久精品日日躁夜夜躁欧美| 国产精品久久久一本精品| 国产精品一级片| 亚洲国产精品精华液ab| 高清国产午夜精品久久久久久| 精品粉嫩超白一线天av| 秋霞av亚洲一区二区三| 欧美一二三四在线| 免费av成人在线| 日韩免费电影一区| 久久国产夜色精品鲁鲁99| 2020国产精品| 成人动漫一区二区在线| 亚洲男人的天堂在线观看| 在线欧美日韩国产| 亚洲成av人片在www色猫咪| 欧美丝袜丝nylons| 日韩精品高清不卡| 欧美一级理论性理论a| 国产综合一区二区| 国产色91在线| 色噜噜狠狠一区二区三区果冻| 亚洲精品国产精品乱码不99| 欧美欧美午夜aⅴ在线观看| 轻轻草成人在线| 国产女同性恋一区二区| 91黄色在线观看| 亚洲一区日韩精品中文字幕| 7777精品伊人久久久大香线蕉完整版| 日韩国产精品久久久| 欧美电影免费观看高清完整版在线 | 亚洲大片一区二区三区| 777精品伊人久久久久大香线蕉| 久久精品国产精品亚洲综合| 久久久亚洲精品石原莉奈| 成人va在线观看| 亚洲v日本v欧美v久久精品| 日韩三级视频中文字幕| 国产精品系列在线观看| 亚洲日本成人在线观看| 91麻豆精品国产91久久久久久久久| 国内精品在线播放| 亚洲一区二区四区蜜桃| 精品国产乱码久久久久久牛牛| 成人av电影在线| 免费欧美在线视频| 亚洲人成精品久久久久| 欧美大片顶级少妇| 91论坛在线播放| 国产在线精品一区二区三区不卡| 亚洲综合激情另类小说区| 久久九九久久九九| 91精品久久久久久久99蜜桃| av一区二区三区黑人| 美日韩一区二区| 亚洲国产欧美日韩另类综合 | 亚洲精品国产精华液| 精品国产乱码久久久久久牛牛 | 经典三级视频一区| 亚洲一区二区三区激情| 亚洲国产成人一区二区三区| 欧美高清一级片在线| 色综合久久久久综合体| 国产精品一区二区三区网站| 日韩影院免费视频| 亚洲超碰97人人做人人爱| 国产精品久久久久毛片软件| 欧美大片日本大片免费观看| 91精品国产乱码久久蜜臀| 欧美综合一区二区| 色综合久久久久久久| 成人黄色免费短视频| 精品一区二区在线看| 麻豆视频观看网址久久| 五月天视频一区| 亚洲第一av色| 一区二区三区欧美激情| 亚洲激情六月丁香| 亚洲精品一二三| 专区另类欧美日韩| 亚洲天堂a在线| 亚洲视频免费在线观看| 亚洲人快播电影网| 亚洲欧美在线观看| 一区二区欧美视频| 亚洲高清免费在线| 亚洲成人av免费| 亚洲成精国产精品女| 成人黄色a**站在线观看| 国产精品中文字幕欧美| 懂色av一区二区三区免费看| 成人午夜在线播放| 91在线国产观看| 欧美午夜一区二区三区| 欧美日韩国产一二三| 欧美一级免费观看| 久久综合国产精品| 亚洲国产高清在线| 亚洲精品精品亚洲| 日韩精品乱码av一区二区| 九一久久久久久| 成人黄色在线看| 日本黄色一区二区| 日韩一区二区三区视频| 欧美精品一区二区高清在线观看| 久久久不卡影院| 亚洲精品日韩综合观看成人91| 亚洲一卡二卡三卡四卡五卡| 久久99国产精品免费| 波多野结衣中文一区| 欧洲激情一区二区| 亚洲精品一区二区三区精华液 | 亚洲在线观看免费| 青青草原综合久久大伊人精品| 韩国v欧美v亚洲v日本v| 色香色香欲天天天影视综合网| 欧美丰满嫩嫩电影| 久久久久久日产精品| 伊人婷婷欧美激情| 国产传媒日韩欧美成人| 欧美中文字幕亚洲一区二区va在线| 欧美大片日本大片免费观看| 亚洲日本一区二区三区| 久久99国产精品久久| 不卡av在线网| 欧美mv日韩mv| 一区二区三区精品视频在线| 国内精品久久久久影院色| 欧美伊人精品成人久久综合97| 久久久国产综合精品女国产盗摄| 亚洲一区在线看| 成人av电影在线播放|