婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > python中pandas對多列進行分組統計的實現

python中pandas對多列進行分組統計的實現

熱門標簽:北京電信外呼系統靠譜嗎 地圖標注視頻廣告 百度地圖標注位置怎么修改 大連crm外呼系統 無錫客服外呼系統一般多少錢 高德地圖標注是免費的嗎 老人電話機器人 梅州外呼業務系統 洪澤縣地圖標注

使用groupby([ ]).size()統計的結果,值相同的字段值會不顯示


如上圖所示,第一個空著的行是982499 7 3388 1,因為此行與前面一行的這兩個字段值是一樣的,所以不顯示。第二個空著的行是390192 22 4278 1,因為此行與前面一行的第一個字段值是一樣的,所以不顯示。這樣的展示方式更直觀,但對于剛用的人,可能會讓其以為是缺失值。

如果還不明白可以看下面的全部數據及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000

res6

user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389

res6['user_id'].value_counts()

390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)

user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64

res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)

user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此這篇關于python中pandas對多列進行分組統計的實現的文章就介紹到這了,更多相關pandas多列分組統計內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python Pandas分組聚合的實現方法
  • 詳解python pandas 分組統計的方法
  • Python Pandas實現數據分組求平均值并填充nan的示例
  • Python學習筆記之pandas索引列、過濾、分組、求和功能示例
  • Python Pandas的簡單使用教程
  • Python pandas入門系列之眾數和分位數
  • Python pandas求方差和標準差的方法實例
  • python geopandas讀取、創建shapefile文件的方法
  • 使用Python pandas讀取CSV文件應該注意什么?
  • 利用python Pandas實現批量拆分Excel與合并Excel
  • python pandas分組聚合詳細

標簽:岳陽 清遠 泉州 長春 洛陽 怒江 吉林 安慶

巨人網絡通訊聲明:本文標題《python中pandas對多列進行分組統計的實現》,本文關鍵詞  python,中,pandas,對,多列,進行,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python中pandas對多列進行分組統計的實現》相關的同類信息!
  • 本頁收集關于python中pandas對多列進行分組統計的實現的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 雷州市| 德清县| 和田市| 桂东县| 绍兴县| 深州市| 阜平县| 丹阳市| 峡江县| 楚雄市| 安徽省| 崇仁县| 英吉沙县| 江城| 南京市| 华宁县| 梁山县| 牟定县| 祁阳县| 长海县| 昌黎县| 高平市| 托克托县| 中牟县| 漳平市| 平定县| 灯塔市| 上犹县| 贵德县| 绍兴市| 徐闻县| 安龙县| 南丹县| 板桥市| 江都市| 稷山县| 沾益县| 邹城市| 百色市| 林州市| 安远县|