婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > pandas group分組與agg聚合的實(shí)例

pandas group分組與agg聚合的實(shí)例

熱門標(biāo)簽:工廠智能電話機(jī)器人 400電話申請服務(wù)商選什么 在哪里辦理400電話號碼 清遠(yuǎn)360地圖標(biāo)注方法 原裝電話機(jī)器人 西藏智能外呼系統(tǒng)五星服務(wù) 平頂山外呼系統(tǒng)免費(fèi) 江蘇客服外呼系統(tǒng)廠家 千陽自動外呼系統(tǒng)

如下:

import pandas as pd
 
df = pd.DataFrame({'Country':['China','China', 'India', 'India', 'America', 'Japan', 'China', 'India'], 
     'Income':[10000, 10000, 5000, 5002, 40000, 50000, 8000, 5000],
     'Age':[5000, 4321, 1234, 4010, 250, 250, 4500, 4321]})

構(gòu)造的數(shù)據(jù)如下:

 Age Country Income
0 5000 China 10000
1 4321 China 10000
2 1234 India 5000
3 4010 India 5002
4 250 America 40000
5 250 Japan 50000
6 4500 China 8000
7 4321 India 5000

分組

單列分組

df_gb = df.groupby('Country')
for index, data in df_gb:
 print(index)
 print(data)

輸出

America
 Age Country Income
4 250 America 40000
China
 Age Country Income
0 5000 China 10000
1 4321 China 10000
6 4500 China 8000
India
 Age Country Income
2 1234 India 5000
3 4010 India 5002
7 4321 India 5000
Japan
 Age Country Income
5 250 Japan 50000

多列分組

df_gb = df.groupby(['Country', 'Income'])
for (index1, index2), data in df_gb:
 print((index1, index2))
 print(data)

輸出

('America', 40000)
 Age Country Income
4 250 America 40000
('China', 8000)
 Age Country Income
6 4500 China 8000
('China', 10000)
 Age Country Income
0 5000 China 10000
1 4321 China 10000
('India', 5000)
 Age Country Income
2 1234 India 5000
7 4321 India 5000
('India', 5002)
 Age Country Income
3 4010 India 5002
('Japan', 50000)
 Age Country Income
5 250 Japan 50000

聚合

對分組后數(shù)據(jù)進(jìn)行聚合

默認(rèn)情況對分組之后其他列進(jìn)行聚合

df_agg = df.groupby('Country').agg(['min', 'mean', 'max'])
print(df_agg)

輸出

 Age     Income      
   min   mean max min   mean max
Country              
America 250 250.000000 250 40000 40000.000000 40000
China 4321 4607.000000 5000 8000 9333.333333 10000
India 1234 3188.333333 4321 5000 5000.666667 5002
Japan  250 250.000000 250 50000 50000.000000 50000

對分組后的部分列進(jìn)行聚合

某些情況,只需要對部分?jǐn)?shù)據(jù)進(jìn)行不同的聚合操作,可以通過字典來構(gòu)建

num_agg = {'Age':['min', 'mean', 'max']}
print(df.groupby('Country').agg(num_agg))

輸出

 Age     
   min   mean max
Country       
America 250 250.000000 250
China 4321 4607.000000 5000
India 1234 3188.333333 4321
Japan  250 250.000000 250
num_agg = {'Age':['min', 'mean', 'max'], 'Income':['min', 'max']}
print(df.groupby('Country').agg(num_agg))

輸出

  Age     Income  
   min   mean max min max
Country          
America 250 250.000000 250 40000 40000
China 4321 4607.000000 5000 8000 10000
India 1234 3188.333333 4321 5000 5002
Japan  250 250.000000 250 50000 50000

補(bǔ)充:pandas——很全的groupby、agg,對表格數(shù)據(jù)分組與統(tǒng)計

我這篇groupby寫的不好。太復(fù)雜了。其實(shí)實(shí)際上經(jīng)常用的就那么幾個。舉個例子,把常用的往那一放就很容易理解和拿來用了。日后再寫一篇。

groupby功能:分組

groupby + agg(聚集函數(shù)們): 分組后,對各組應(yīng)用一些函數(shù),如'sum',‘mean',‘max',‘min'…

groupby默認(rèn)縱方向上分組,axis=0

DataFrame
import pandas as pd
import numpy as np
 df = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'],
     'key2':['one', 'two', 'one', 'two', 'one'],
     'data1':np.random.randn(5),
     'data2':np.random.randn(5)})
print(df)
  data1  data2 key1 key2
0 -0.410122 0.247895 a one
1 -0.627470 -0.989268 a two
2 0.179488 -0.054570 b one
3 -0.299878 -1.640494 b two
4 -0.297191 0.954447 a one

分組,并對分組進(jìn)行迭代

list(df.groupby(['key1']))#list后得到:[(group1),(group2),......]
[('a',  data1  data2 key1 key2
 0 -0.410122 0.247895 a one
 1 -0.627470 -0.989268 a two
 4 -0.297191 0.954447 a one), ('b',  data1  data2 key1 key2
 2 0.179488 -0.054570 b one
 3 -0.299878 -1.640494 b two)]

list后得到:[(group1),(group2),…]

每個數(shù)據(jù)片(group)格式: (name,group)元組

1. 按key1(一個列)分組,其實(shí)是按key1的值

groupby對象支持迭代,產(chǎn)生一組二元元組:(分組名,數(shù)據(jù)塊),(分組名,數(shù)據(jù)塊)…

for name,group in df.groupby(['key1']):
 print(name)
 print(group)
a
  data1  data2 key1 key2
0 -0.410122 0.247895 a one
1 -0.627470 -0.989268 a two
4 -0.297191 0.954447 a one
b
  data1  data2 key1 key2
2 0.179488 -0.054570 b one
3 -0.299878 -1.640494 b two

2. 按[key1, key2](多個列)分組

對于多重鍵,產(chǎn)生的一組二元元組:((k1,k2),數(shù)據(jù)塊),((k1,k2),數(shù)據(jù)塊)…

第一個元素是由鍵值組成的元組

for name,group in df.groupby(['key1','key2']):
 print(name) #name=(k1,k2)
 print(group)
('a', 'one')
  data1  data2 key1 key2
0 -0.410122 0.247895 a one
4 -0.297191 0.954447 a one
('a', 'two')
  data1  data2 key1 key2
1 -0.62747 -0.989268 a two
('b', 'one')
  data1 data2 key1 key2
2 0.179488 -0.05457 b one
('b', 'two')
  data1  data2 key1 key2
3 -0.299878 -1.640494 b two

3. 按函數(shù)分組

4. 按字典分組

5. 按索引級別分組

6.將函數(shù)跟數(shù)組、列表、字典、Series混合使用也不是問題,因為任何東西最終都會被轉(zhuǎn)換為數(shù)組

將這些數(shù)據(jù)片段做成字典

dict(list(df.groupby(['key1'])))#dict(list())
{'a':  data1  data2 key1 key2
 0 -0.410122 0.247895 a one
 1 -0.627470 -0.989268 a two
 4 -0.297191 0.954447 a one, 'b':  data1  data2 key1 key2
 2 0.179488 -0.054570 b one
 3 -0.299878 -1.640494 b two}

分組后進(jìn)行一些統(tǒng)計、計算等

1. 分組后,返回一個含有分組大小的Series

按key1分組

df.groupby(['key1']).size()
key1
a 3
b 2
dtype: int64
dict(['a1','x2','e3'])



{'a': '1', 'e': '3', 'x': '2'}

按[key1,key2]分組

df.groupby(['key1','key2']).size()
key1 key2
a  one  2
  two  1
b  one  1
  two  1
dtype: int64

2. 對data1按key1進(jìn)行分組,并計算data1列的平均值

df['data1'].groupby(df['key1']).mean()
#groupby沒有進(jìn)行任何的計算。它只是進(jìn)行了一個分組
key1
a -0.444928
b -0.060195
Name: data1, dtype: float64
df.groupby(['key1'])['data1'].mean()#理解:對df按key1分組,并計算分組后df['data1']的均值
#等價于:df.groupby(['key1']).data1.mean()
key1
a -0.444928
b -0.060195
Name: data1, dtype: float64

說明:

groupby沒有進(jìn)行任何的計算。它只是進(jìn)行了一個分組。

數(shù)據(jù)(Series)根據(jù)分組鍵進(jìn)行了聚合,產(chǎn)生了一個新的Series,其索引為key1列中的唯一值。

這種索引操作所返回的對象是一個已分組的DataFrame(如果傳入的是列表或數(shù)組)或已分組的Series

df.groupby(['key1'])['data1'].size()
key1
a 3
b 2
Name: data1, dtype: int64

3.對data1按[key1,key2]進(jìn)行分組,并計算data1的平均值

df['data1'].groupby([df['key1'],df['key2']]).mean()
key1 key2
a  one -0.353657
  two -0.627470
b  one  0.179488
  two -0.299878
Name: data1, dtype: float64
df.groupby(['key1','key2'])['data1'].mean()
#等價于:df.groupby(['key1','key2']).data1'.mean()
key1 key2
a  one -0.353657
  two -0.627470
b  one  0.179488
  two -0.299878
Name: data1, dtype: float64

通過兩個鍵對數(shù)據(jù)進(jìn)行了分組,得到的Series具有一個層次化索引(由唯一的鍵對組成):

df.groupby(['key1','key2'])['data1'].mean().unstack()
key2 one two
key1
a -0.353657 -0.627470
b 0.179488 -0.299878

在上面這些示例中,分組鍵均為Series。實(shí)際上,分組鍵可以是任何長度適當(dāng)?shù)臄?shù)組。非常靈活。

橫方向上

按列的數(shù)據(jù)類型(df.dtypes)來分

df共兩種數(shù)據(jù)類型:float64和object,所以會分為兩組(dtype(‘float64'),數(shù)據(jù)片),(dtype(‘O'), 數(shù)據(jù)片)

list(df.groupby(df.dtypes, axis=1))
[(dtype('float64'),  data1  data2
 0 -0.410122 0.247895
 1 -0.627470 -0.989268
 2 0.179488 -0.054570
 3 -0.299878 -1.640494
 4 -0.297191 0.954447), (dtype('O'), key1 key2
 0 a one
 1 a two
 2 b one
 3 b two
 4 a one)]

agg的應(yīng)用

groupby+agg 可以對groupby的結(jié)果同時應(yīng)用多個函數(shù)

SeriesGroupBy的方法agg()參數(shù):

aggregate(self, func_or_funcs, * args, ** kwargs)
func: function, string, dictionary, or list of string/functions

返回:aggregated的Series

s= pd.Series([10,20,30,40])
s
0 10
1 20
2 30
3 40
dtype: int64
for n,g in s.groupby([1,1,2,2]):
 print(n)
 print(g)
0 10
1 20
dtype: int64
2
2 30
3 40
dtype: int64
s.groupby([1,1,2,2]).min()
1
1 10
2 30
dtype: int64
#等價于這個:
s.groupby([1,1,2,2]).agg('min')
1 10
2 30
dtype: int64
s.groupby([1,1,2,2]).agg(['min','max'])#加[],func僅接受一個參數(shù)
min max
1 10 20
2 30 40

常常這樣用:

df

data1 data2 key1 key2
0 -0.410122 0.247895 a one
1 -0.627470 -0.989268 a two
2 0.179488 -0.054570 b one
3 -0.299878 -1.640494 b two
4 -0.297191 0.954447 a one

比較下面,可以看出agg的用處:

df.groupby(['key1'])['data1'].min()
key1
a -0.627470
b -0.299878
Name: data1, dtype: float64
df.groupby(['key1'])['data1'].agg({'min'})
min
key1
a -0.627470
b -0.299878
#推薦用這個√
df.groupby(['key1']).agg({'data1':'min'})#對data1列,取各組的最小值,名字還是data1
data1
key1
a -0.627470
b -0.299878
#按key1分組后,aggregate各組data1的最小值和最大值:
df.groupby(['key1'])['data1'].agg({'min','max'})
max min
key1
a -0.297191 -0.627470
b 0.179488 -0.299878
#推薦用這個√
df.groupby(['key1']).agg({'data1':['min','max']})
data1
min max
key1
a -0.627470 -0.297191
b -0.299878 0.179488

可以對groupby的結(jié)果更正列名(不推薦用這個,哪怕在后面單獨(dú)更改列名)

# 對data1,把min更名為a,max更名為b
df.groupby(['key1'])['data1'].agg({'a':'min','b':'max'})#這里的'min' 'max'為兩個函數(shù)名
d:\python27\lib\site-packages\ipykernel_launcher.py:2: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version
a b
key1
a -0.627470 -0.297191
b -0.299878 0.179488

重要技巧: groupby之后直接.reset_index()可以得到一個沒有多級索引的DataFrame

之后可以通過df.rename({‘old_col1':‘new_col1',‘old_col2':‘new_col2',…})重命名

eg:

df1= df.groupby(['date'])['price'].agg({'sum','count'}).reset_index()

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • Pandas中DataFrame的分組/分割/合并的實(shí)現(xiàn)
  • pandas 實(shí)現(xiàn)分組后取第N行
  • pandas分組排序 如何獲取第二大的數(shù)據(jù)
  • pandas groupby分組對象的組內(nèi)排序解決方案
  • pandas組內(nèi)排序,并在每個分組內(nèi)按序打上序號的操作
  • pandas 實(shí)現(xiàn)某一列分組,其他列合并成list

標(biāo)簽:隨州 安慶 西安 錦州 白城 股票 日照 天水

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pandas group分組與agg聚合的實(shí)例》,本文關(guān)鍵詞  pandas,group,分組,與,agg,聚合,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pandas group分組與agg聚合的實(shí)例》相關(guān)的同類信息!
  • 本頁收集關(guān)于pandas group分組與agg聚合的實(shí)例的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    一本到不卡精品视频在线观看 | 久久精品国产久精国产| 中文字幕在线观看一区二区| **性色生活片久久毛片| 亚洲国产欧美在线人成| 国产一区二区中文字幕| 成人黄色小视频| 欧美男人的天堂一二区| 国产日韩欧美综合一区| 日本系列欧美系列| 国产精品国产三级国产普通话99 | 久久久电影一区二区三区| 日本一区二区免费在线| 一区二区三区在线免费| 日韩av网站在线观看| 99久久久无码国产精品| 国产精品国产三级国产aⅴ入口 | 中文久久乱码一区二区| 国内成+人亚洲+欧美+综合在线| 狠狠狠色丁香婷婷综合激情| 色哟哟一区二区在线观看 | 亚洲精品一区二区三区99| 亚洲精品乱码久久久久久久久| 成人福利视频网站| 欧美xfplay| 美女视频黄 久久| 久久久精品国产免大香伊| 成人免费电影视频| 亚洲在线视频一区| 欧美日韩一区中文字幕| 日韩精品乱码av一区二区| 日韩三级视频中文字幕| 国产高清一区日本| 亚洲一区二区三区四区不卡| 精品福利av导航| 91网址在线看| 日本午夜一区二区| 欧美大片在线观看一区二区| 成人97人人超碰人人99| 奇米综合一区二区三区精品视频| 国产日韩欧美一区二区三区综合| 欧美日免费三级在线| 成熟亚洲日本毛茸茸凸凹| 99久精品国产| 日韩av一级电影| 亚洲乱码国产乱码精品精98午夜 | 韩国女主播成人在线| 亚洲蜜臀av乱码久久精品| 亚洲精品一区二区三区四区高清| 色综合久久天天| 成人黄页毛片网站| 国产成人av自拍| 美女国产一区二区| 一区二区三区中文在线观看| 日韩欧美国产一二三区| 欧美日韩中文字幕一区| 99视频精品全部免费在线| 狠狠色丁香婷婷综合久久片| 秋霞影院一区二区| 亚洲午夜视频在线| 亚洲欧洲无码一区二区三区| 26uuu国产日韩综合| 亚洲精品一线二线三线无人区| 日韩视频免费观看高清在线视频| 欧美精品v国产精品v日韩精品| 欧美中文字幕一二三区视频| 欧美视频日韩视频| 在线观看日韩国产| 欧美丰满一区二区免费视频 | 99国产精品视频免费观看| 蓝色福利精品导航| 毛片av一区二区| 美女在线观看视频一区二区| 亚洲第一福利视频在线| 亚洲国产aⅴ天堂久久| 亚洲视频精选在线| 欧美国产日韩精品免费观看| 91精品国产综合久久小美女| 欧美丝袜丝交足nylons| 欧日韩精品视频| 欧美日韩一区二区三区在线| 欧美性猛片aaaaaaa做受| 91高清视频免费看| 欧美日韩国产美| 久久综合久久综合久久综合| 国产精品久久午夜夜伦鲁鲁| 亚洲免费观看高清在线观看| 亚洲电影一级片| 国产一区二区毛片| 色欧美片视频在线观看在线视频| 色婷婷精品久久二区二区蜜臂av| 欧美日韩一区精品| 91精品国产一区二区三区香蕉| 精品国产乱码久久久久久图片| 国产精品久久久久久久岛一牛影视 | 国产精品素人一区二区| 美女高潮久久久| 国产精品欧美久久久久无广告| av成人免费在线观看| 亚洲一区二区三区四区五区黄| 久久精品欧美一区二区三区不卡| 日本一二三不卡| 国产成人av电影在线| 日本成人中文字幕| 天天色 色综合| 亚洲国产一区二区三区| 一区二区三区色| 亚洲精品视频免费看| 成人免费在线观看入口| 136国产福利精品导航| 国产精品视频免费| 亚洲免费看黄网站| 亚洲妇女屁股眼交7| 日韩精品久久理论片| 理论电影国产精品| 成人少妇影院yyyy| 99热这里都是精品| 国产一区二区三区免费| 成人网男人的天堂| 在线观看欧美黄色| 日韩写真欧美这视频| 国产精品乱人伦| 亚洲一区在线观看免费 | 亚洲精品一线二线三线无人区| 欧美一区二区三区四区久久| 久久久国产午夜精品| 国产精品乱码一区二区三区软件| 亚洲一区在线播放| 国内成人精品2018免费看| 一本到不卡精品视频在线观看| 日韩三级av在线播放| 亚洲精品乱码久久久久久久久| 奇米综合一区二区三区精品视频| 国产高清久久久| 日韩精品一区二区在线观看| 伊人夜夜躁av伊人久久| 国产一区日韩二区欧美三区| 欧美日韩视频在线第一区| 国产精品女同一区二区三区| 狠狠色丁香久久婷婷综合_中| 欧美三级日韩三级| 亚洲另类在线视频| av一本久道久久综合久久鬼色| 精品日韩欧美一区二区| 日韩激情视频网站| 在线视频综合导航| 亚洲美女精品一区| 92国产精品观看| 亚洲色图欧洲色图婷婷| 成人精品免费视频| 国产精品亲子伦对白| 国产电影一区在线| 26uuu精品一区二区| 国产综合久久久久久久久久久久| 欧美大片一区二区| 亚洲成人动漫精品| 精品视频一区三区九区| 亚洲三级在线观看| 欧美三级电影在线看| 午夜精品福利一区二区三区av | 欧美丝袜自拍制服另类| 国产农村妇女毛片精品久久麻豆 | 一区二区三区资源| av资源网一区| 国产精品五月天| 99久免费精品视频在线观看| 欧美精品一区在线观看| 久久不见久久见中文字幕免费| 91精品国产福利在线观看| 欧美韩日一区二区三区四区| 91网站最新网址| 污片在线观看一区二区| 日韩久久免费av| 国产亚洲自拍一区| 国产精品99久久久久| 一区二区三区在线观看网站| 在线视频你懂得一区| 日韩免费视频线观看| 亚洲成av人片在线观看| 婷婷综合久久一区二区三区| 欧美日韩一区 二区 三区 久久精品| 亚洲人一二三区| 日韩免费看的电影| 99精品国产视频| 日韩高清不卡在线| 亚洲色图欧洲色图婷婷| 欧美www视频| 欧美婷婷六月丁香综合色| 精品综合久久久久久8888| 夜色激情一区二区| 国产精品乱码人人做人人爱| 欧美一区二区在线不卡| 在线观看av一区| 成人黄页在线观看| 国产精品99久久久久久久vr| 日韩中文字幕1| 日日嗨av一区二区三区四区| 欧美韩国日本一区| 日韩精品一区二区三区四区视频| 婷婷夜色潮精品综合在线|