StoreID | Sales | SalesDate | Channel |
---|---|---|---|
A | 100 | 2018/1/1 | 01 |
A | 90 | 2018/1/1 | 02 |
A | 110 | 2018/1/2 | 01 |
B | 82.2 | 2018/1/1 | 01 |
B | 90 | 2018/1/2 | 02 |
如果要按StoreID來統計每一家店的營業日期數(可以通過不計重復的count “SalesDate”來完成)
代碼如下:
data.groupby(['StoreID']).SalesDate.nunique()
補充:pandas 統計分組內不重復計數
在數據分析中的數據處理過程中,經常需要對數據進行分組計數,看下下面這組數據
數據中name 為C 的有三行,其中有2個code是重復的
按name 分組,統計每組中code的不重復數量
df.groupby('name')['code'].nunique() # 以name 分組后,統計code的不重復數目
結果如下:
df.groupby('name')['code'].nunique().sort_values(ascending=False) # 以name 分組后,統計code的不重復數目
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
下一篇:PyTorch數據讀取的實現示例