婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 使用pandas模塊實現數據的標準化操作

使用pandas模塊實現數據的標準化操作

熱門標簽:哈爾濱ai外呼系統定制 陜西金融外呼系統 公司電話機器人 激戰2地圖標注 騰訊外呼線路 海南400電話如何申請 白銀外呼系統 唐山智能外呼系統一般多少錢 廣告地圖標注app

如下所示:

3σ 原則 (u-3*σ ,u+3*σ )
離差標準化 (x-min)/(max-min)
標準差標準化 (x-u)/σ
小數定標標準化

x/10**k

k=np.ceil(log10(max(|x|)))

1.3σ原則

u 均值

σ 標準差

正太分布的數據基本都分布在(u-3σ,u+3σ)范圍內

其他的數據

import pandas as pd
import numpy as np
def three_sigma(se):
    """
    自實現3σ原則,進行數據過濾
    :param se:傳進來的series結構數據
    :return:去除異常值之后的series數據
    """
    bool_id=((se.mean()-3*se.std())se)  (se(se.mean()+3*se.std()))
    print(bool_id)
    return se[bool_id]
 
#加載數據
detail=pd.read_excel('./meal_order_detail.xlsx')
#進行異常值處理
res=three_sigma(detail['amounts'])
print(detail.shape)
print(res.shape)

2.離差標準化

(x-min)/(max-min)
import pandas as pd
import numpy as np
 
def minmax_sca(data):
    """
    離差標準化
    param data:傳入的數據
    return:標準化之后的數據
    """
    new_data=(data-data.min())/(data.max()-data.min())
    return new_data
 
#加載數據
detail=pd.read_excel('./meal_order_detail.xlsx')
res=minmax_sca(detail[['amounts','counts']])
print(res)
data=res
bool_id=data.loc[:,'count']==1
print(data.loc[bool_id],'counts')

3.標準差標準化

(x-u)/σ

異常值對標準差標準化的影響不大

轉化之后的數據--->均值0 標準差1

import pandas as pd
import numpy as np
def stand_sca(data):
    """
    標準差標準化
    :param data:傳入的數據
    :return:標準化之后的數據
    """
    new_data=(data-data.mean())/data.std()
    return new_data
 
#加載數據
detail=pd.read_excel('./meal_order_detail.xlsx')
res=stand_sca(detail[['amounts','counts']])
print(res)
print('res的均值:',res.mean())
print('res的標準差:',res.std())

4.小數定標標準化

x/(10^k)
k=math.ceil(log10(max(|x|)))

以10為底,x的絕對值的最大值的對數 最后進行向上取整

import pandas as pd
import numpy as np
def deci_sca(data):
    """
    自實現小數定標標準化
    :param data: 傳入的數據
    :return: 標準化之后的數據
    """
    new_data=data/(10**(np.ceil(np.log10(data.abs().max()))))
    return new_data
#加載數據
detail = pd.read_excel('./meal_order_detail.xlsx')
res = deci_sca(detail[['amounts', 'counts']])
print(res)

補充:pandas數據處理基礎之標準化與標簽數值化

fit(): Method calculates the parameters μ and σ and saves them as internal objects.

解釋:簡單來說,就是求得訓練集X的均值,方差,最大值,最小值,這些訓練集X固有的屬性。

transform(): Method using these calculated parameters apply the transformation to a particular dataset.

解釋:在fit的基礎上,進行標準化,降維,歸一化等操作(看具體用的是哪個工具,如PCA,StandardScaler等)。

fit_transform(): joins the fit() and transform() method for transformation of dataset.

解釋:fit_transform是fit和transform的組合,既包括了訓練又包含了轉換。 transform()和fit_transform()二者的功能都是對數據進行某種統一處理(比如標準化~N(0,1),將數據縮放(映射)到某個固定區間,歸一化,正則化等)

fit_transform(trainData)對部分數據先擬合fit,找到該part的整體指標,如均值、方差、最大值最小值等等(根據具體轉換的目的),然后對該trainData進行轉換transform,從而實現數據的標準化、歸一化等等。

Note:

必須先用fit_transform(trainData),之后再transform(testData)

如果直接transform(testData),程序會報錯

如果fit_transfrom(trainData)后,使用fit_transform(testData)而不transform(testData),雖然也能歸一化,但是兩個結果不是在同一個“標準”下的,具有明顯差異。(一定要避免這種情況)

注意:StandardScaler().fit_transform(x,fit_params),fit_params決定標準化的標簽數據,就是每個標準化的標桿數據,此參數不同,則每次標準化的過程則不同。

from sklearn import preprocessing
# 獲取數據
cols = ['OverallQual','GrLivArea', 'GarageCars','TotalBsmtSF', 'FullBath', 'TotRmsAbvGrd', 'YearBuilt'] ##選取列
x = data_train[cols].values
y = data_train['SalePrice'].values  
x_scaled = preprocessing.StandardScaler().fit_transform(x) ##進行歸一化
y_scaled = preprocessing.StandardScaler().fit_transform(y.reshape(-1,1))##先將y轉換成一列,再進行歸一
 

還有以下形式,和上面的標準化原理一致,都是先fit,再transform。

由ss決定標準化進程的獨特性

# 先將數據標準化
from sklearn.preprocessing import StandardScaler
ss = StandardScaler() ##
#用測試集訓練并標準化
ss.fit(missing_age_X_train)##首先fit
missing_age_X_train = ss.transform(missing_age_X_train) #進行transform
missing_age_X_test = ss.transform(missing_age_X_test)

標簽數值化

1.當某列數據不是數值型數據時,將難以標準化,此時要將數據轉化成數據型形式。

數據處理前數據顯示:

經過標簽化數據處理

from sklearn import preprocessing
f_names = ['CentralAir', 'Neighborhood'] ##需要處理的數據標簽 
for x in f_names:
    label = preprocessing.LabelEncoder()
    data_train[x] = label.fit_transform(data_train[x]) ##數據標準化

處理之后變成:

2.當某列有對應的標簽值時,即某個量對應相應確定的標簽時,例如oldtown就對應1,sawyer就對應2,分類的str轉換為序列類這時使用如下:

數據處理之前

利用轉換:

title_mapping = {"Mr": 1, "Miss": 2, "Mrs": 3, "Master": 4, "Rare": 5}#將標簽對應數值
train_df['Title'] = train_df['Title'].map(title_mapping)#處理數據
train_df['Title'] = train_df['Title'].fillna(0)##將其余標簽填充為0值

處理過后:

3.多個數據標簽需要分列采用one_hot形式時,處理之前

處理之后

train_test.loc[train_test["Age"].isnull() ,"age_nan"] = 1 ##將標簽轉換成1
train_test.loc[train_test["Age"].notnull() ,"age_nan"] = 0##將此標簽成為0
train_test = pd.get_dummies(train_test,columns=['age_nan']) ##columns決定哪幾行分列處理,prefix參數是每列前綴

one_hot 形式轉變成功。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • pandas 對每一列數據進行標準化的方法
  • pandas數據處理之 標簽列字符轉數字的實現
  • pandas數據處理進階詳解
  • Pandas 數據處理,數據清洗詳解

標簽:惠州 鷹潭 上海 常德 黑龍江 四川 益陽 黔西

巨人網絡通訊聲明:本文標題《使用pandas模塊實現數據的標準化操作》,本文關鍵詞  使用,pandas,模塊,實現,數據,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《使用pandas模塊實現數據的標準化操作》相關的同類信息!
  • 本頁收集關于使用pandas模塊實現數據的標準化操作的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    亚洲成人免费观看| www久久久久| 亚洲午夜精品一区二区三区他趣| 日韩精品一区二区三区老鸭窝 | 欧美日韩一区二区三区在线看| 国产a区久久久| 亚洲在线视频免费观看| 久久久久久久久久看片| 国产精品久久毛片a| 日韩成人av影视| 成人av网址在线| 午夜视频一区在线观看| 日韩精品一区国产麻豆| 国产福利电影一区二区三区| 亚洲一区在线观看免费| 中文字幕中文乱码欧美一区二区 | 亚洲福中文字幕伊人影院| 日韩精品中文字幕在线不卡尤物 | 天天色 色综合| 亚洲在线中文字幕| 中文字幕视频一区| 亚洲日本在线观看| 久久精品在线观看| 在线电影一区二区三区| 欧美喷水一区二区| 欧美三区在线观看| 欧美一级欧美三级| 欧美精品一区二区蜜臀亚洲| 久久久久久久久久久久久夜| 久久伊人蜜桃av一区二区| 久久九九影视网| 日本一区二区视频在线观看| 国产拍欧美日韩视频二区| 国产精品久久久久久久久搜平片| 一色屋精品亚洲香蕉网站| 国产精品天干天干在线综合| 国产精品美女久久久久高潮| 中文字幕一区在线观看| 亚洲一区二区三区视频在线播放| 性久久久久久久久久久久| 久久www免费人成看片高清| 国产成人亚洲精品狼色在线| av电影天堂一区二区在线| 色婷婷国产精品综合在线观看| 欧美亚男人的天堂| 欧美成人一级视频| 91精品啪在线观看国产60岁| 久久免费看少妇高潮| 国产精品久久久久四虎| 一区二区视频在线看| 亚洲成av人片一区二区三区| 国产成人综合视频| 成人黄色片在线观看| 欧美性生活影院| 91麻豆精品91久久久久同性| 久久精品日产第一区二区三区高清版| 91精品国产福利在线观看| 91精品午夜视频| 久久人人97超碰com| 午夜日韩在线观看| 久久福利资源站| 成人免费黄色大片| 884aa四虎影成人精品一区| 久久精品人人做人人爽97| 亚洲成人一区在线| 久久中文字幕电影| 一本久久综合亚洲鲁鲁五月天| 偷偷要91色婷婷| 中文字幕在线观看一区| 欧美视频一区二区| 国产成人免费在线观看| 欧美丰满少妇xxxxx高潮对白 | 国产精品视频一二三区| 日本大胆欧美人术艺术动态| 91麻豆精品在线观看| 日韩欧美aaaaaa| 亚洲精品免费在线| 播五月开心婷婷综合| 日韩视频在线永久播放| 午夜精品成人在线视频| 欧美日韩中文国产| 欧美精品一区男女天堂| 久久电影网电视剧免费观看| 欧美精品v国产精品v日韩精品| 亚洲一区二区三区激情| 91福利国产精品| 青青草视频一区| 97精品国产97久久久久久久久久久久 | 色婷婷av一区二区三区之一色屋| 欧美一级夜夜爽| 久久精品国产在热久久| 欧美视频一区二区三区四区 | 色婷婷综合久久久久中文| 亚洲视频一区在线| 成人性生交大片免费看在线播放| 久久综合九色欧美综合狠狠| 国产在线精品不卡| 亚洲精选视频在线| 欧美一区二区三区婷婷月色| 国产精品综合一区二区三区| 亚洲欧美在线aaa| 在线综合亚洲欧美在线视频| 亚洲最大成人综合| 精品久久久久久久久久久久久久久 | 欧美日韩精品一区二区在线播放| 欧美久久久久久蜜桃| 亚洲bt欧美bt精品| 欧美日韩免费电影| 99精品视频中文字幕| 欧美日韩国产综合草草| 亚洲在线免费播放| 91精品一区二区三区久久久久久| 国产在线精品一区二区夜色| 亚洲高清免费视频| 久久久久国产一区二区三区四区| 欧美日韩夫妻久久| 国产麻豆精品在线观看| 亚洲mv大片欧洲mv大片精品| 国产精品青草综合久久久久99| 欧美成人一区二区三区片免费| 91捆绑美女网站| 高清久久久久久| 欧美视频在线观看一区二区| 91美女片黄在线| 色诱亚洲精品久久久久久| 国产成人综合亚洲网站| 日韩电影一二三区| 亚洲女爱视频在线| 日韩一区二区免费电影| 欧美亚洲国产bt| aaa欧美色吧激情视频| 久久99国产精品久久99果冻传媒| 亚洲黄色av一区| 亚洲精品在线三区| 欧美一区二区在线播放| 欧美在线观看一区| 在线一区二区观看| 欧美日韩亚洲丝袜制服| 欧美女孩性生活视频| 欧美精品日韩一区| 日韩一区二区三区av| 国产网站一区二区三区| 国产亚洲一本大道中文在线| 依依成人综合视频| 午夜精品久久久久久久99樱桃| 久久不见久久见免费视频1| 国产成人精品亚洲777人妖| 国产麻豆精品视频| 欧美日韩免费视频| 久久午夜色播影院免费高清| 中文字幕成人在线观看| 日韩一区精品字幕| 国产成人精品一区二区三区网站观看| av激情综合网| 久久久久久久综合狠狠综合| 午夜视频在线观看一区二区| 国产一区二区久久| 91麻豆文化传媒在线观看| 精品国产乱码久久久久久老虎| 亚洲欧美视频在线观看视频| 亚洲欧洲综合另类| 免费成人在线视频观看| 成人97人人超碰人人99| 欧美日韩成人高清| 亚洲欧洲国产日本综合| 五月综合激情日本mⅴ| 国产自产视频一区二区三区| 日韩一级高清毛片| 久久精品免费在线观看| 亚洲午夜免费电影| 91麻豆精品一区二区三区| 国产婷婷色一区二区三区在线| 午夜视频在线观看一区二区 | 91论坛在线播放| 久久一二三国产| 麻豆精品国产传媒mv男同| 成人性生交大片免费看视频在线 | 99久久精品国产麻豆演员表| 国产目拍亚洲精品99久久精品| 国产米奇在线777精品观看| 欧美成人精品福利| 国产麻豆精品theporn| 国产欧美日韩三区| hitomi一区二区三区精品| 国产精品三级久久久久三级| 99在线视频精品| 天天综合网天天综合色| 欧美日韩大陆一区二区| 国内成人精品2018免费看| 国产精品超碰97尤物18| 欧美精品少妇一区二区三区| 国产在线不卡视频| 亚洲人成人一区二区在线观看| 在线不卡一区二区| 成人国产精品免费观看视频| 亚洲国产精品自拍| 精品国产1区2区3区| 欧美影视一区在线| 激情深爱一区二区| 亚洲欧洲精品天堂一级|