婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲入門教程02之筆趣閣小說爬取

Python爬蟲入門教程02之筆趣閣小說爬取

熱門標簽:萬利達百貨商場地圖標注 熱門電銷機器人 上海企業外呼系統 電話機器人哪里有賣 okcc外呼系統怎么調速度 智能機器人電銷神器 河南虛擬外呼系統公司 惠州龍門400電話要怎么申請 外呼電信系統

前言

本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理。

前文

01、python爬蟲入門教程01:豆瓣Top電影爬取

基本開發環境

  • Python 3.6
  • Pycharm

相關模塊的使用

  • request
  • sparsel

安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。

單章爬取

一、明確需求

爬取小說內容保存到本地

  • 小說名字
  • 小說章節名字
  • 小說內容
# 第一章小說url地址
url = 'http://www.biquges.com/52_52642/25585323.html'
url = 'http://www.biquges.com/52_52642/25585323.html'
headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
print(response.text)

請求網頁返回的數據中出現了亂碼,這就需要我們轉碼了。

加一行代碼自動轉碼。

response.encoding = response.apparent_encoding

三、解析數據

根據css選擇器可以直接提取小說標題以及小說內容。

def get_one_novel(html_url):
 # 調用請求網頁數據函數
 response = get_response(html_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 獲取小說標題
 title = selector.css('.bookname h1::text').get()
 # 獲取小說內容 返回的是list
 content_list = selector.css('#content::text').getall()
 # ''.join(列表) 把列表轉換成字符串
 content_str = ''.join(content_list)
 print(title, content_str)

if __name__ == '__main__':
 url = 'http://www.biquges.com/52_52642/25585323.html'
 get_one_novel(url)

四、保存數據(數據持久化)

使用常用的保存方式: with open

def save(title, content):
 """
 保存小說
 :param title: 小說章節標題
 :param content: 小說內容
 :return: 
 """
 # 路徑
 filename = f'{title}\\'
 # os 內置模塊,自動創建文件夾
 if os.makedirs(filename):
 os.mkdir()
 # 一定要記得加后綴 .txt mode 保存方式 a 是追加保存 encoding 保存編碼
 with open(filename + title + '.txt', mode='a', encoding='utf-8') as f:
 # 寫入標題
 f.write(title)
 # 換行
 f.write('\n')
 # 寫入小說內容
 f.write(content)


保存一章小說,就這樣寫完了,如果想要保存整本小說呢?

整本小說爬蟲

既然爬取單章小說知道怎么爬取了,那么只需要獲取小說所有單章小說的url地址,就可以爬取全部小說內容了。

所有的單章的url地址都在 dd 標簽當中,但是這個url地址是不完整的,所以爬取下來的時候,要拼接url地址。

def get_all_url(html_url):
 # 調用請求網頁數據函數
 response = get_response(html_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 所有的url地址都在 a 標簽里面的 href 屬性中 
 dds = selector.css('#list dd a::attr(href)').getall()
 for dd in dds:
 novel_url = 'http://www.biquges.com' + dd
 print(novel_url)


if __name__ == '__main__':
 url = 'http://www.biquges.com/52_52642/index.html'
 get_all_url(url)

這樣就獲取了所有的小說章節url地址了。

爬取全本完整代碼

import requests
import parsel
from tqdm import tqdm


def get_response(html_url):
 headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
 }
 response = requests.get(url=html_url, headers=headers)
 response.encoding = response.apparent_encoding
 return response


def save(novel_name, title, content):
 """
 保存小說
 :param title: 小說章節標題
 :param content: 小說內容
 :return:
 """
 filename = f'{novel_name}' + '.txt'
 # 一定要記得加后綴 .txt mode 保存方式 a 是追加保存 encoding 保存編碼
 with open(filename, mode='a', encoding='utf-8') as f:
 # 寫入標題
 f.write(title)
 # 換行
 f.write('\n')
 # 寫入小說內容
 f.write(content)


def get_one_novel(name, novel_url):
 # 調用請求網頁數據函數
 response = get_response(novel_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 獲取小說標題
 title = selector.css('.bookname h1::text').get()
 # 獲取小說內容 返回的是list
 content_list = selector.css('#content::text').getall()
 # ''.join(列表) 把列表轉換成字符串
 content_str = ''.join(content_list)
 save(name, title, content_str)


def get_all_url(html_url):
 # 調用請求網頁數據函數
 response = get_response(html_url)
 # 轉行成selector解析對象
 selector = parsel.Selector(response.text)
 # 所有的url地址都在 a 標簽里面的 href 屬性中
 dds = selector.css('#list dd a::attr(href)').getall()
 # 小說名字
 novel_name = selector.css('#info h1::text').get()
 for dd in tqdm(dds):
 novel_url = 'http://www.biquges.com' + dd
 get_one_novel(novel_name, novel_url)

if __name__ == '__main__':
 novel_id = input('輸入書名ID:')
 url = f'http://www.biquges.com/{novel_id}/index.html'
 get_all_url(url)


到此這篇關于Python爬蟲入門教程02之筆趣閣小說爬取的文章就介紹到這了,更多相關Python爬蟲筆趣閣小說爬取內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python 爬取國內小說網站
  • python 爬取小說并下載的示例
  • python爬取”頂點小說網“《純陽劍尊》的示例代碼
  • Python爬取365好書中小說代碼實例
  • Python實現的爬取小說爬蟲功能示例
  • Python scrapy爬取起點中文網小說榜單
  • python爬蟲之爬取筆趣閣小說升級版

標簽:淮安 周口 秦皇島 周口 綏化 百色 合肥 綿陽

巨人網絡通訊聲明:本文標題《Python爬蟲入門教程02之筆趣閣小說爬取》,本文關鍵詞  Python,爬蟲,入門教程,之筆,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲入門教程02之筆趣閣小說爬取》相關的同類信息!
  • 本頁收集關于Python爬蟲入門教程02之筆趣閣小說爬取的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    91在线一区二区三区| 免费在线欧美视频| 亚洲国产高清在线观看视频| ㊣最新国产の精品bt伙计久久| 成人动漫一区二区在线| 欧美欧美欧美欧美首页| 国产精品视频九色porn| 日本不卡123| 韩日欧美一区二区三区| 欧美日韩在线播放一区| 国产欧美精品日韩区二区麻豆天美| 亚洲综合区在线| 99re视频精品| 日韩一级在线观看| 一区二区三区在线观看网站| 成人一区二区三区在线观看 | 91在线免费播放| 精品国产a毛片| 国产成人精品亚洲日本在线桃色| 成人免费在线视频| 欧美日韩在线亚洲一区蜜芽| 免费成人在线影院| 国产精品嫩草影院av蜜臀| 不卡一区在线观看| 美女视频一区二区三区| 国产日韩欧美电影| 日本久久一区二区| 国产一区欧美日韩| 一区二区不卡在线视频 午夜欧美不卡在| 91免费国产在线| 激情文学综合插| 亚洲色图在线播放| 精品久久久久久久一区二区蜜臀| 成人动漫在线一区| 极品少妇xxxx精品少妇偷拍| 亚洲婷婷在线视频| 久久日韩粉嫩一区二区三区| 色综合久久综合| 国产一区二区三区四区五区入口 | 日精品一区二区三区| 久久久噜噜噜久噜久久综合| 美腿丝袜亚洲一区| 欧美日本一区二区三区四区| 国产精品污网站| 亚洲精品你懂的| 亚洲6080在线| 国产伦精品一区二区三区免费| 成人激情文学综合网| 精品国产亚洲在线| 日韩av在线免费观看不卡| 欧美三级视频在线播放| 国产欧美日韩在线看| 久久福利视频一区二区| 国产很黄免费观看久久| 色婷婷亚洲婷婷| 欧美一区二区福利在线| 中文字幕在线一区免费| 亚洲3atv精品一区二区三区| 久久se精品一区精品二区| 99久久99精品久久久久久 | 丁香桃色午夜亚洲一区二区三区 | 欧美丰满一区二区免费视频| 久久这里只有精品6| 亚洲欧美日本在线| 国产一区二区在线观看免费| 欧美亚洲免费在线一区| 久久综合九色综合久久久精品综合| 亚洲男女一区二区三区| 国产曰批免费观看久久久| 欧美在线观看禁18| 久久色中文字幕| 午夜影院久久久| 成人国产电影网| 日韩免费观看高清完整版| 一区二区三区资源| 日韩精品一区在线观看| 一区二区在线观看视频| 成人网男人的天堂| 久久久久国产精品麻豆| 日本一道高清亚洲日美韩| 91久久精品日日躁夜夜躁欧美| 久久久影视传媒| 蜜桃传媒麻豆第一区在线观看| 欧美午夜影院一区| 亚洲色图另类专区| 成人黄色免费短视频| 精品国产精品网麻豆系列| 亚洲一区日韩精品中文字幕| 97aⅴ精品视频一二三区| 国产女人水真多18毛片18精品视频| 经典一区二区三区| 欧美少妇一区二区| 91精品中文字幕一区二区三区| 国产寡妇亲子伦一区二区| 日韩精品免费专区| 国产精品久久久久久久久久久免费看| 欧美高清视频在线高清观看mv色露露十八| 午夜精品福利在线| 有码一区二区三区| 1000精品久久久久久久久| 久久综合网色—综合色88| 亚洲女性喷水在线观看一区| 亚洲视频狠狠干| 99热精品国产| 日韩一区二区三| 精品一区二区免费视频| 欧美大片在线观看一区二区| 韩日精品视频一区| 久久亚洲一区二区三区明星换脸| 午夜免费欧美电影| 精品噜噜噜噜久久久久久久久试看 | 久久九九久精品国产免费直播| 99视频热这里只有精品免费| 国产成人精品影视| 日韩欧美色电影| 在线免费观看视频一区| 在线精品视频一区二区三四| 成人动漫精品一区二区| 国产喷白浆一区二区三区| 亚洲国产日日夜夜| 亚洲精品中文字幕在线观看| 偷拍与自拍一区| 国产精品欧美久久久久一区二区 | 精品久久久久99| 中文字幕精品在线不卡| 久久综合久久鬼色| 久久综合视频网| 精品欧美乱码久久久久久1区2区| 波多野结衣一区二区三区| 日韩成人一区二区三区在线观看| 国产精品素人视频| 欧美国产欧美综合| 中文字幕国产一区| 日韩成人免费电影| 色婷婷久久久久swag精品| 欧美精品vⅰdeose4hd| 亚洲猫色日本管| 久久99精品国产91久久来源| 国产成人在线电影| 欧美韩国一区二区| 日韩av电影天堂| 欧美日韩一区久久| 日本va欧美va欧美va精品| 欧美日韩一区二区三区免费看| 一区二区三区欧美日| 日韩一区二区在线观看| 99久久er热在这里只有精品15 | 欧美成人精品高清在线播放| 国产亲近乱来精品视频| 26uuu久久天堂性欧美| 18成人在线观看| 色播五月激情综合网| 亚洲欧洲精品天堂一级| 日本高清无吗v一区| 欧美日韩一区高清| 亚洲va国产va欧美va观看| 91在线看国产| 亚洲精品欧美二区三区中文字幕| 久久99精品国产麻豆婷婷| 欧美伊人精品成人久久综合97| 中文字幕一区二区三| 黄色日韩三级电影| 日本一区二区三区在线不卡| 婷婷中文字幕一区三区| 国产性天天综合网| 中文字幕一区二区不卡| 91精品国产综合久久精品图片| 久久99精品久久久久久动态图| 国产蜜臀av在线一区二区三区| 色8久久人人97超碰香蕉987| 高清在线不卡av| 亚洲欧美乱综合| 国产女人18毛片水真多成人如厕 | 中文字幕一区免费在线观看| 欧美唯美清纯偷拍| 91丨九色丨黑人外教| 成人免费视频网站在线观看| 国产一区二区三区免费看 | 2021中文字幕一区亚洲| 91精品国产入口| 欧美电视剧在线看免费| 精品精品国产高清一毛片一天堂| 欧美一区中文字幕| 欧美一级精品大片| 精品欧美一区二区三区精品久久| 精品日韩在线观看| 久久婷婷国产综合精品青草| 国产亚洲一本大道中文在线| 国产欧美日韩在线| 国产精品美女久久久久高潮| 国产精品电影一区二区三区| 国产精品久久一级| 亚洲美女免费视频| 午夜精品视频一区| 捆绑紧缚一区二区三区视频| 国产成a人无v码亚洲福利| 91色在线porny| 777欧美精品| 久久久噜噜噜久久人人看| 亚洲色图另类专区|