婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python爬蟲爬取愛奇藝電影片庫首頁的實例代碼

Python爬蟲爬取愛奇藝電影片庫首頁的實例代碼

熱門標(biāo)簽:江蘇房產(chǎn)電銷機器人廠家 荊州云電銷機器人供應(yīng)商 蘇州電銷機器人十大排行榜 幫人做地圖標(biāo)注收費算詐騙嗎 外呼不封號系統(tǒng) 電信營業(yè)廳400電話申請 溫州旅游地圖標(biāo)注 悟空智電銷機器人6 遼寧400電話辦理多少錢

上篇文章給大家介紹了Python爬取愛奇藝電影信息代碼實例 感興趣的朋友點擊查看下。

今天給大家介紹Python爬蟲爬取愛奇藝電影片庫首頁,下面是實例代碼,參考下:

import time
import traceback
import requests
from lxml import etree
import re
from bs4 import BeautifulSoup
from lxml.html.diff import end_tag
import json
import pymysql
#連接數(shù)據(jù)庫  獲取游標(biāo)
def get_conn():
    """
    :return: 連接,游標(biāo)
    """
    # 創(chuàng)建連接
    conn = pymysql.connect(host="82.157.112.34",
                    user="root",
                    password="root",
                    db="MovieRankings",
                    charset="utf8")
    # 創(chuàng)建游標(biāo)
    cursor = conn.cursor()  # 執(zhí)行完畢返回的結(jié)果集默認(rèn)以元組顯示
    if ((conn != None)  (cursor != None)):
        print("數(shù)據(jù)庫連接成功!游標(biāo)創(chuàng)建成功!")
    else:
        print("數(shù)據(jù)庫連接失敗!")
    return conn, cursor
#關(guān)閉數(shù)據(jù)庫連接和游標(biāo)
def close_conn(conn, cursor):
    if cursor:
        cursor.close()
    if conn:
        conn.close()
    return 1
def get_iqy():
    #   獲取數(shù)據(jù)庫總數(shù)據(jù)條數(shù)
    conn, cursor = get_conn()
    sql = "select count(*) from movieiqy"
    cursor.execute(sql)     #   執(zhí)行sql語句
    conn.commit()       #   提交事務(wù)
    all_num = cursor.fetchall()[0][0]       #cursor 返回值的類型是一個元祖的嵌套形式 比如( ( ) ,)
    pagenum=int(all_num/48)+1               #這里是計算一個下面循環(huán)的起始值    每48個電影分一組
    print(pagenum)
    print("movieiqy數(shù)據(jù)庫有", all_num, "條數(shù)據(jù)!")


    url = "https://pcw-api.iqiyi.com/search/recommend/list?channel_id=1data_type=1mode=11page_id=1ret_num=48session=ee4d98ebb4e8e44c8d4b14fa90615fb7"
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36"
    }
    # response=requests.get(url=url,headers=headers)
    # response.encoding="utf-8"
    # page_text=response.text
    # print(page_text)
    """
    """
    #
    temp_list = []      #暫時存放單部電影的數(shù)據(jù)
    dataRes = []        #每次循環(huán)把單部電影數(shù)據(jù)放到這個list
    for i in range(pagenum+1, pagenum+100):         #循環(huán)100-1次
        url = "https://pcw-api.iqiyi.com/search/recommend/list?channel_id=1data_type=1mode=11page_id=1ret_num=48session=ee4d98ebb4e8e44c8d4b14fa90615fb7"
        url_0 = "https://pcw-api.iqiyi.com/search/recommend/list?channel_id=1data_type=1mode=11page_id="
        url_0 = url_0 + str(i) + "ret_num=48session=ad1d98bb953b7e5852ff097c088d66f2"
        print(url_0)        #輸出拼接好的url
        response = requests.get(url=url_0, headers=headers)
        response.encoding = "utf-8"
        page_text = response.text
        #解析json對象
        json_obj = json.loads(page_text)
        #這里的異常捕獲是因為     測試循環(huán)的次數(shù)有可能超過電影網(wǎng)站提供的電影數(shù) 為了防止后續(xù)爬到空的json對象報錯
        try:
            json_list = json_obj['data']['list']
        except KeyError:
            return dataRes          #json為空 程序結(jié)束
        for j in json_list:         #   開始循環(huán)遍歷json串
            # print(json_list)
            name = j['name']        #找到電影名
            print(name)
            temp_list.append(name)
            #異常捕獲,防止出現(xiàn)電影沒有評分的現(xiàn)象
            try:
                score = j['score']      #找到電影評分
                print(score)
                temp_list.append(score)
            except KeyError:
                print( "KeyError")
                temp_list.append("iqy暫無評分")            #替換字符串

            link = j['playUrl']             #找到電影鏈接
            temp_list.append(link)
            # 解析播放狀態(tài)
            state = []
            pay_text = j['payMarkUrl']          #因為播放狀態(tài)只有在一個圖片鏈接里有 所以需要使用re解析出類似vip和only(獨播)的字樣
            if (len(pay_text) == 0):            #如果沒有這個圖片鏈接 說明電影是免費播放
                state="免費"
            else:
                find_state = re.compile("(.*?).png")
                state = re.findall(find_state, pay_text)        #正則匹配鏈接找到vip
                if(len(state)!=0):              #只有當(dāng)鏈接不為空再執(zhí)行
                    # print(state)
                    # 再次解析
                    state = state[0][0:3]       #字符串分片

                    # 這里只輸出了三個字符,如果是獨播,頁面顯示的是only,我們設(shè)置為”獨播“
                    if (state == "onl"):
                        state = "獨播"
                    else:
                        state = "VIP"
            # print(state)
            # 添加播放狀態(tài)
            temp_list.append(state)
            dataRes.append(temp_list)
            # print(temp_list)
            temp_list = []

        print('___________________________')
    return dataRes

def insert_iqy():
    cursor = None
    conn = None
    try:
        count=0
        list = get_iqy()
        print(f"{time.asctime()}開始插入愛奇藝電影數(shù)據(jù)")
        conn, cursor = get_conn()
        sql = "insert into movieiqy (id,name,score,path,state) values(%s,%s,%s,%s,%s)"
        for item in list:
            print(item)
            count = count + 1
            if (count % 48 == 0):
                print('___________________________')
            #異常捕獲,防止數(shù)據(jù)庫主鍵沖突
            try:
                cursor.execute(sql, [0, item[0], item[1], item[2], item[3] ])
            except pymysql.err.IntegrityError:
                print("重復(fù)!跳過!")

        conn.commit()  # 提交事務(wù) update delete insert操作
        print(f"{time.asctime()}插入愛奇藝電影數(shù)據(jù)完畢")
    except:
        traceback.print_exc()
    finally:
        close_conn(conn, cursor)
    return;

if __name__ == '__main__':
    # get_iqy()
    insert_iqy()

到此這篇關(guān)于Python爬蟲爬取愛奇藝電影片庫首頁的實例代碼的文章就介紹到這了,更多相關(guān)Python爬取愛奇藝電影內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python編程開發(fā)之textwrap文本樣式處理技巧
  • Python的文本常量與字符串模板之string庫
  • Python中使用subprocess庫創(chuàng)建附加進(jìn)程
  • Python超簡單容易上手的畫圖工具庫推薦
  • python爬蟲請求庫httpx和parsel解析庫的使用測評
  • Python高級文件操作之shutil庫詳解
  • Python超簡單容易上手的畫圖工具庫(適合新手)
  • python學(xué)習(xí)之panda數(shù)據(jù)分析核心支持庫
  • Python基礎(chǔ)之操作MySQL數(shù)據(jù)庫
  • Python繪圖庫Matplotlib的基本用法
  • Python Excel處理庫openpyxl詳解
  • python使用openpyxl庫讀寫Excel表格的方法(增刪改查操作)
  • Python time庫的時間時鐘處理
  • Python基礎(chǔ)之常用庫常用方法整理
  • python數(shù)據(jù)庫批量插入數(shù)據(jù)的實現(xiàn)(executemany的使用)
  • Python爬蟲之必備chardet庫
  • python中requests庫+xpath+lxml簡單使用
  • Python格式化文本段落之textwrap庫

標(biāo)簽:黃山 宿遷 欽州 景德鎮(zhèn) 喀什 濟南 臺灣 三沙

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬蟲爬取愛奇藝電影片庫首頁的實例代碼》,本文關(guān)鍵詞  Python,爬蟲,爬取,愛奇,藝,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬蟲爬取愛奇藝電影片庫首頁的實例代碼》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python爬蟲爬取愛奇藝電影片庫首頁的實例代碼的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    欧美色欧美亚洲另类二区| 狠狠久久亚洲欧美| 国产精品不卡在线观看| 精品入口麻豆88视频| 日韩亚洲欧美高清| 欧美一区二区三区色| 日韩欧美电影一区| 精品捆绑美女sm三区| 欧美电视剧在线看免费| 精品入口麻豆88视频| 2020国产成人综合网| 久久青草国产手机看片福利盒子| 日韩精品中文字幕一区二区三区| 日韩精品一区二区三区视频播放 | 欧美—级在线免费片| 国产日韩欧美综合在线| 国产精品乱人伦一区二区| 成人免费在线视频观看| 亚洲综合免费观看高清在线观看| 亚洲图片欧美色图| 极品瑜伽女神91| 成人av网站在线观看| 91久久精品午夜一区二区| 在线观看91av| 国产欧美日韩在线视频| 亚洲免费成人av| 蜜臀av一区二区在线观看| 久久国产精品免费| 99re热视频精品| 91精品婷婷国产综合久久性色| 久久一夜天堂av一区二区三区| 国产精品视频一二三区| 亚洲成人资源网| 国产一区二区三区黄视频| 91精彩视频在线| 欧美电影免费观看高清完整版在线观看| 亚洲国产精品成人综合 | 国产精品入口麻豆原神| 亚洲宅男天堂在线观看无病毒| 日本亚洲天堂网| 成人国产精品视频| 欧美一级欧美三级在线观看| 国产精品久久久久精k8| 免费在线视频一区| 色av成人天堂桃色av| 精品国产污网站| 亚洲美腿欧美偷拍| 国产风韵犹存在线视精品| 欧美日韩精品一区二区| 国产精品日产欧美久久久久| 激情综合色播五月| 在线不卡一区二区| 尤物在线观看一区| 成人午夜av电影| 亚洲精品在线免费播放| 天天色天天爱天天射综合| 99久久精品国产精品久久| 2021中文字幕一区亚洲| 日韩中文字幕av电影| 色婷婷综合视频在线观看| 国产日韩av一区| 麻豆一区二区三| 欧美一区二区日韩| 亚洲一区二区美女| 日本道在线观看一区二区| 国产精品国产三级国产有无不卡 | 亚洲国产一区在线观看| 99精品视频一区二区| 欧美激情一二三区| 成人精品免费视频| 欧美国产日产图区| 国产激情视频一区二区在线观看 | 成人黄色国产精品网站大全在线免费观看 | 免费成人av资源网| 欧美午夜宅男影院| 亚洲午夜在线电影| 欧美日韩1234| 日韩 欧美一区二区三区| 欧美视频在线一区二区三区| 亚洲精选视频免费看| 欧美在线观看视频一区二区三区| 亚洲欧美视频一区| 欧美麻豆精品久久久久久| 视频一区二区三区中文字幕| 欧美一级搡bbbb搡bbbb| 国内精品久久久久影院色| 国产日产欧美一区| 99精品一区二区三区| 亚洲黄色性网站| 欧美一区二区三区电影| 国产精品中文字幕日韩精品| 国产精品你懂的| 欧洲一区二区三区免费视频| 日韩激情视频网站| 久久色中文字幕| 91小视频在线免费看| 一区二区三区在线免费播放| 欧美日韩三级在线| 国产在线不卡一区| 亚洲视频一区二区在线| 欧美日韩免费高清一区色橹橹| 久久精品国产77777蜜臀| 国产网红主播福利一区二区| 91最新地址在线播放| 免费成人美女在线观看.| 欧美韩日一区二区三区四区| 色综合中文字幕| 麻豆一区二区三| 亚洲欧美色图小说| 精品成人一区二区| 在线一区二区三区| 国产精品一区二区三区四区 | 欧美一级高清大全免费观看| 高清免费成人av| 亚洲国产欧美在线| 中文字幕欧美区| 欧美一区二区三区人| 91亚洲国产成人精品一区二区三 | 国产精品亚洲综合一区在线观看| 亚洲伦在线观看| 久久久91精品国产一区二区三区| 欧美视频日韩视频| 国产91精品在线观看| 肉丝袜脚交视频一区二区| 亚洲欧洲无码一区二区三区| 91精品国产综合久久久久| 99久久精品免费看国产免费软件| 日本不卡不码高清免费观看 | 精品美女在线观看| 欧洲一区在线电影| 91一区二区在线观看| 成人免费不卡视频| 国产一区高清在线| 美女任你摸久久| 欧美bbbbb| 午夜日韩在线电影| 亚洲午夜免费视频| 依依成人综合视频| 亚洲伦在线观看| 亚洲精品久久7777| 自拍偷拍亚洲激情| 亚洲欧美一区二区三区极速播放 | 日本免费在线视频不卡一不卡二| 亚洲日本免费电影| 亚洲欧洲日韩在线| 国产精品超碰97尤物18| 国产精品国产三级国产普通话蜜臀 | 中文字幕不卡在线播放| 久久久久国产成人精品亚洲午夜| 欧美一级二级三级蜜桃| 欧美成人精品3d动漫h| 欧美一区二区在线不卡| 欧美一级高清片在线观看| 日韩欧美高清在线| 久久精品人人做人人爽人人| 亚洲精品一区二区三区蜜桃下载| 精品国产免费人成在线观看| 久久久久国产一区二区三区四区| 国产三级三级三级精品8ⅰ区| 欧美国产精品一区二区| 中国av一区二区三区| 国产精品萝li| 一区二区免费在线播放| 亚洲成人在线网站| 久草中文综合在线| 国产高清不卡二三区| 99精品视频在线观看| 欧美丝袜丝nylons| 久久一夜天堂av一区二区三区| 国产欧美日韩卡一| 亚洲一级二级三级在线免费观看| 青青草伊人久久| 成人中文字幕合集| 欧美色图一区二区三区| 9191精品国产综合久久久久久| 精品国产sm最大网站免费看| 中文字幕在线播放不卡一区| 日韩影院精彩在线| 国产成人午夜电影网| 精品视频全国免费看| 久久综合九色综合97婷婷女人| 亚洲欧美一区二区三区孕妇| 视频在线观看一区| 成人免费va视频| 欧美一区二区三区四区高清| 国产精品私人影院| 免费精品视频在线| 色香蕉成人二区免费| 精品日韩在线观看| 亚洲va欧美va人人爽| 成人黄色网址在线观看| 制服丝袜亚洲播放| 最新不卡av在线| 久久国产尿小便嘘嘘尿| 欧美日韩中文字幕一区二区| 亚洲国产成人午夜在线一区 | 五月天欧美精品| 成人av电影在线观看| 欧美大片一区二区| 午夜电影久久久|