婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 端午節將至,用Python爬取粽子數據并可視化,看看網友喜歡哪種粽子吧!

端午節將至,用Python爬取粽子數據并可視化,看看網友喜歡哪種粽子吧!

熱門標簽:孝感營銷電話機器人效果怎么樣 騰訊地圖標注沒法顯示 商家地圖標注海報 打電話機器人營銷 地圖標注自己和別人標注區別 海外網吧地圖標注注冊 聊城語音外呼系統 南陽打電話機器人 ai電銷機器人的優勢

一、前言

本文就從數據爬取數據清洗數據可視化,這三個方面入手,但你簡單完成一個小型的數據分析項目,讓你對知識能夠有一個綜合的運用。

整個思路如下:

  • 爬取網頁:https://www.jd.com/
  • 爬取說明: 基于京東網站,我們搜索網站“粽子”數據,大概有100頁。我們爬取的字段,既有一級頁面的相關信息,還有二級頁面的部分信息;
  • 爬取思路: 先針對某一頁數據的一級頁面做一個解析,然后再進行二級頁面做一個解析,最后再進行翻頁操作;
  • 爬取字段: 分別是粽子的名稱(標題)、價格、品牌(店鋪)、類別(口味);
  • 使用工具: requests+lxml+pandas+time+re+pyecharts
  • 網站解析方式: xpath

最終的效果如下:

二、數據爬取

京東網站,一般是動態加載的,也就是說,采用一般方式只能爬取到某個頁面的前30個數據(一個頁面一共60個數據)。

基于本文,我僅用最基本的方法,爬取了每個頁面的前30條數據(如果大家有興趣,可以自行下去爬取所有的數據)。

那么,本文究竟爬取了哪些字段呢?我給大家做一個展示,大家有興趣,可以爬取更多的字段,做更為詳細的分析。

下面為大家展示爬蟲代碼:

import pandas as pd
import requests
from lxml import etree
import chardet
import time
import re
 
def get_CI(url):
    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; X64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36'}
    rqg = requests.get(url,headers=headers)
    rqg.encoding = chardet.detect(rqg.content)['encoding']
    html = etree.HTML(rqg.text)
    
    # 價格
    p_price = html.xpath('//div/div[@class="p-price"]/strong/i/text()')
    
    # 名稱
    p_name = html.xpath('//div/div[@class="p-name p-name-type-2"]/a/em')
    p_name = [str(p_name[i].xpath('string(.)')) for i in range(len(p_name))]
    
    # 深層url
    deep_ur1 = html.xpath('//div/div[@class="p-name p-name-type-2"]/a/@href')
    deep_url = ["http:" + i for i in deep_ur1]
    
    # 從這里開始,我們獲取“二級頁面”的信息           
    brands_list = []
    kinds_list = []
    for i in deep_url:
        rqg = requests.get(i,headers=headers)
        rqg.encoding = chardet.detect(rqg.content)['encoding']
        html = etree.HTML(rqg.text)
                          
        # 品牌
        brands = html.xpath('//div/div[@class="ETab"]//ul[@id="parameter-brand"]/li/@title')
        brands_list.append(brands)
                        
        # 類別
        kinds = re.findall('>類別:(.*?)/li>',rqg.text)
        kinds_list.append(kinds)
                           
    data = pd.DataFrame({'名稱':p_name,'價格':p_price,'品牌':brands_list,'類別':kinds_list})
    return(data)
                           
x = "https://search.jd.com/Search?keyword=%E7%B2%BD%E5%AD%90qrst=1wq=%E7%B2%BD%E5%AD%90stock=1page="
url_list = [x + str(i) for i in range(1,200,2)]
res = pd.DataFrame(columns=['名稱','價格','品牌','類別'])
 
# 這里進行“翻頁”操作
for url in url_list:
    res0 = get_CI(url)
    res = pd.concat([res,res0])
    time.sleep(3)
 
# 保存數據
res.to_csv('aliang.csv',encoding='utf_8_sig')

最終爬取到的數據:

三、數據清洗

從上圖可以看到,整個數據算是很整齊的,不是特別亂,我們只做一些簡單的操作即可。

先使用pandas庫,來讀取數據。

import pandas as pd
 
df = pd.read_excel("粽子.xlsx",index_col=False)
df.head()

結果如下:

我們分別針對 “品牌”“類別 兩個字段,去掉中括號。

df["品牌"] = df["品牌"].apply(lambda x: x[1:-1])
df["類別"] = df["類別"].apply(lambda x: x[1:-1])
df.head()

結果如下:

①  粽子品牌排名前10的店鋪

df["品牌"].value_counts()[:10]

結果如下:

② 粽子口味排名前5的味道

def func1(x):
    if x.find("甜") > 0:
        return "甜粽子"
    else:
        return x
df["類別"] = df["類別"].apply(func1)
df["類別"].value_counts()[1:6]

結果如下:

③ 粽子售賣價格區間劃分

def price_range(x): # 按照我的購物習慣,劃分價格
    if x = 50:
        return '50元'
    elif x = 100:
        return '50-100元'
    elif x = 300:
        return '100-300元'
    elif x = 500:
        return '300-500元'
    elif x = 1000:
        return '500-1000元'
    else:
        return '>1000元'
 
df["價格區間"] = df["價格"].apply(price_range)
df["價格區間"].value_counts()

結果如下:

由于數據不是很多,沒有很多字段,也就沒有很多亂數據。因此,這里也沒有做數據去重、缺失值填充等操作。所以,大家可以下去獲取更多字段,更多數據,用于數據分析。

四、數據可視化

俗話說:字不如表,表不如圖。通過可視化分析,我們可以將數據背后 “隱藏” 的信息,給展現出來。

拓展: 當然,這里只是 “拋磚引玉”,我并沒有獲取太多的數據,也沒有獲取太多的字段。這里給學習的朋友當一個作業題,自己下去用更多的數據、更多的字段,做更透徹的分析。

在這里,我們基于以下幾個問題,做一個可視化展示,分別是:

  • ① 粽子銷售店鋪Top10柱形圖;
  • ② 粽子口味排名Top5柱形圖;
  • ③ 粽子銷售價格區間劃分餅圖;
  • ④ 粽子商品名稱詞云圖;

① 粽子銷售店鋪Top10柱形圖

結論分析:去年,我們分析了一些月餅的數據,“五芳齋”“北京稻香村” 這幾個牌子記憶猶新,可謂是做月餅、粽子的老店。像 “三全” 和 “思念”,在我印象中一直以為它們只做水餃和湯圓,粽子是否值得一試呢?當然,這里還有一些新的牌子,像 “諸老大”“稻香私房” 等一些牌子,大家都可以下去搜索一下。買東西,就是要精挑細選,品牌也重要。

② 粽子口味排名Top5柱形圖

結論分析:在我印象中,小時候一直吃的最多的就是 “甜粽子”,直到我上了初中才知道,粽子還可以有肉?當然,從圖中可以看出,賣 “鮮肉粽” 的店鋪還是居多,畢竟這個送人,還是顯得高端、大氣一些。這里還有一些口味,像 “蜜棗粽”“豆沙粽”,我基本沒吃過。如果你送人,你會送什么口味的呢?

③ 粽子銷售價格區間劃分餅圖

結論分析:這里,我故意把價格區間細分。這個餅圖也很符合實際,畢竟每年就過一次端午節,還是以薄利多銷為主,接近80%的粽子,售價都在100元以下。當然,還有一些中檔的粽子,價格在100-300元。大于300元,我覺得也沒有吃的必要,反正我是不會花這么多錢去買粽子。

④ 粽子商品名稱詞云圖

結論分析:從圖中,可以大致看出商家的賣點了。畢竟是節日,“送禮”“禮品” 體現了節日氛圍。“豬肉”“豆沙” 體現了粽子口味。當然,它是否是 “早餐” 好選擇呢?購買的話,還支持 “團購” 哦。這些字眼,多多少少都會各自吸引一部分人的眼球。

⑤ 圖形組合為大屏

​到此這篇關于端午節將至,用Python將粽子數據可視化,看看網友喜歡哪種吧!的文章就介紹到這了,更多相關Python數據可視化內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python爬蟲實戰之爬取京東商品數據并實實現數據可視化
  • Python爬取股票信息,并可視化數據的示例
  • Python爬取數據并實現可視化代碼解析
  • python如何爬取網站數據并進行數據可視化

標簽:六盤水 牡丹江 聊城 南寧 揚州 楊凌 迪慶 撫州

巨人網絡通訊聲明:本文標題《端午節將至,用Python爬取粽子數據并可視化,看看網友喜歡哪種粽子吧!》,本文關鍵詞  端午節,將至,用,Python,爬取,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《端午節將至,用Python爬取粽子數據并可視化,看看網友喜歡哪種粽子吧!》相關的同類信息!
  • 本頁收集關于端午節將至,用Python爬取粽子數據并可視化,看看網友喜歡哪種粽子吧!的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    777奇米成人网| 日本少妇一区二区| 久久网站热最新地址| 成人短视频下载| 亚洲一区二区av在线| 欧美mv日韩mv国产| 欧美性生交片4| 成人动漫一区二区| 国产成人综合自拍| 日韩1区2区3区| 午夜av一区二区三区| 中文字幕日韩av资源站| 久久九九影视网| 91麻豆精品91久久久久久清纯| 成人在线综合网| 成人一级视频在线观看| 喷水一区二区三区| 视频一区二区中文字幕| 一区二区国产视频| 最新国产精品久久精品| 国产精品国产三级国产专播品爱网| 亚洲精品在线免费播放| 日韩欧美高清dvd碟片| 91精品久久久久久久99蜜桃| 91精品国产色综合久久不卡蜜臀| 欧美在线观看一区| 在线精品视频小说1| 欧美性大战久久| 欧美日韩国产另类一区| 欧美日韩一区成人| 欧美综合在线视频| 91麻豆精品国产91久久久久| 5858s免费视频成人| 日韩亚洲欧美在线| www国产成人| 中日韩av电影| 夜夜爽夜夜爽精品视频| 日韩av电影一区| 国产一区 二区 三区一级| www.激情成人| 欧美日韩一区小说| 欧美精品一区二区精品网| 日本一区二区三区dvd视频在线| 中日韩av电影| 天堂蜜桃91精品| 国产美女一区二区三区| 色婷婷久久久亚洲一区二区三区| 欧美日韩在线播| 欧美日韩一区二区电影| 精品久久人人做人人爽| 精品对白一区国产伦| 成人免费小视频| 综合久久综合久久| 另类小说色综合网站| 国产精品一二三四| 99麻豆久久久国产精品免费优播| 成人动漫在线一区| 日韩免费视频一区二区| 国产精品日韩成人| 日韩在线a电影| 国产精品一区二区不卡| 色综合夜色一区| 日韩精品综合一本久道在线视频| www激情久久| 亚洲尤物在线视频观看| 捆绑调教一区二区三区| 91理论电影在线观看| 欧美久久久久久久久| 久久久精品免费网站| 亚洲综合免费观看高清完整版在线 | 一区二区三区在线高清| 精品在线一区二区| 色综合天天综合狠狠| 国产日韩欧美综合在线| 亚洲国产你懂的| 成人黄色小视频在线观看| 精品日韩一区二区三区免费视频| 日韩毛片视频在线看| 国产精品18久久久久| 欧美人伦禁忌dvd放荡欲情| 国产欧美久久久精品影院| 精品一区二区三区在线播放视频| 91美女蜜桃在线| 日韩毛片视频在线看| 国产成人亚洲综合a∨婷婷| 日韩欧美一二区| 午夜av电影一区| 欧美亚日韩国产aⅴ精品中极品| 国产清纯白嫩初高生在线观看91| 日本伊人色综合网| 在线免费精品视频| 亚洲国产另类av| 一本高清dvd不卡在线观看| 国产精品美女久久久久久久网站| 极品美女销魂一区二区三区免费| 51精品秘密在线观看| 天天做天天摸天天爽国产一区| 欧美性猛交xxxxxx富婆| 亚洲国产另类av| 91精品国产一区二区人妖| 麻豆精品国产91久久久久久| 日韩一级黄色大片| 久久精品av麻豆的观看方式| 亚洲高清免费视频| 粉嫩欧美一区二区三区高清影视| 久久中文字幕电影| 国产永久精品大片wwwapp| 精品国产乱码久久久久久蜜臀 | 国产精品青草综合久久久久99| 九九精品一区二区| 精品国产免费一区二区三区四区| 国产一区91精品张津瑜| 欧美激情一区二区三区全黄| 不卡一区在线观看| 成人欧美一区二区三区在线播放| 欧美在线免费观看视频| 偷拍日韩校园综合在线| 精品卡一卡二卡三卡四在线| 国产精品系列在线观看| 国产精品护士白丝一区av| 在线免费一区三区| 久久av资源站| 国产亚洲欧美日韩日本| 99久久精品国产毛片| 亚洲一区在线看| 日韩精品一区二区在线| 国产精品1024久久| 亚洲与欧洲av电影| 欧美mv日韩mv亚洲| 色诱视频网站一区| 免费高清在线一区| 国产精品三级av| 欧美另类变人与禽xxxxx| 久久av资源网| 亚洲欧美色一区| 日韩美女一区二区三区| 成人深夜福利app| 亚洲成av人片| 久久综合国产精品| 欧美精品电影在线播放| 国产在线精品一区二区不卡了| 一区二区三区国产精华| 欧美成人欧美edvon| 色综合天天综合色综合av| 麻豆精品久久久| 亚洲国产cao| 国产欧美精品一区二区三区四区 | 手机精品视频在线观看| 欧美国产日韩在线观看| 在线播放欧美女士性生活| 精品一区二区三区视频| 亚洲va在线va天堂| 国产精品成人免费| 国产午夜精品美女毛片视频| 欧美日韩一区二区电影| www.亚洲人| 国产在线精品免费| 久久精品国产亚洲5555| 亚洲激情自拍偷拍| 国产精品成人免费| 久久精品亚洲精品国产欧美kt∨| 欧美区一区二区三区| 欧美亚男人的天堂| 91欧美一区二区| 国产激情一区二区三区四区 | 极品瑜伽女神91| 午夜欧美在线一二页| 一区二区三区视频在线观看| 国产欧美中文在线| 久久久久国产免费免费| 东方aⅴ免费观看久久av| 国内精品不卡在线| 日韩国产欧美在线视频| 天天色天天操综合| 一区二区三区免费看视频| 一级日本不卡的影视| 亚洲国产一二三| 一区二区三区日韩| 午夜精品一区在线观看| 亚洲一级二级三级在线免费观看| 成人免费一区二区三区视频 | 日本成人在线视频网站| 亚洲色图19p| 亚洲成人在线网站| 日韩一级免费一区| 欧洲国内综合视频| 国产99精品视频| 天天影视涩香欲综合网| 国产精品美女视频| 亚洲免费在线电影| 欧美精品亚洲二区| 婷婷六月综合亚洲| 自拍偷自拍亚洲精品播放| 成人高清伦理免费影院在线观看| 亚洲色图都市小说| 亚洲综合色婷婷| 国产人妖乱国产精品人妖| 久久色.com| 久久精品国产精品青草| 国产精品私房写真福利视频|