婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識(shí)庫 > 使用pandas模塊實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化操作

使用pandas模塊實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化操作

熱門標(biāo)簽:哈爾濱ai外呼系統(tǒng)定制 陜西金融外呼系統(tǒng) 公司電話機(jī)器人 激戰(zhàn)2地圖標(biāo)注 騰訊外呼線路 海南400電話如何申請(qǐng) 白銀外呼系統(tǒng) 唐山智能外呼系統(tǒng)一般多少錢 廣告地圖標(biāo)注app

如下所示:

3σ 原則 (u-3*σ ,u+3*σ )
離差標(biāo)準(zhǔn)化 (x-min)/(max-min)
標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化 (x-u)/σ
小數(shù)定標(biāo)標(biāo)準(zhǔn)化

x/10**k

k=np.ceil(log10(max(|x|)))

1.3σ原則

u 均值

σ 標(biāo)準(zhǔn)差

正太分布的數(shù)據(jù)基本都分布在(u-3σ,u+3σ)范圍內(nèi)

其他的數(shù)據(jù)

import pandas as pd
import numpy as np
def three_sigma(se):
    """
    自實(shí)現(xiàn)3σ原則,進(jìn)行數(shù)據(jù)過濾
    :param se:傳進(jìn)來的series結(jié)構(gòu)數(shù)據(jù)
    :return:去除異常值之后的series數(shù)據(jù)
    """
    bool_id=((se.mean()-3*se.std())se)  (se(se.mean()+3*se.std()))
    print(bool_id)
    return se[bool_id]
 
#加載數(shù)據(jù)
detail=pd.read_excel('./meal_order_detail.xlsx')
#進(jìn)行異常值處理
res=three_sigma(detail['amounts'])
print(detail.shape)
print(res.shape)

2.離差標(biāo)準(zhǔn)化

(x-min)/(max-min)
import pandas as pd
import numpy as np
 
def minmax_sca(data):
    """
    離差標(biāo)準(zhǔn)化
    param data:傳入的數(shù)據(jù)
    return:標(biāo)準(zhǔn)化之后的數(shù)據(jù)
    """
    new_data=(data-data.min())/(data.max()-data.min())
    return new_data
 
#加載數(shù)據(jù)
detail=pd.read_excel('./meal_order_detail.xlsx')
res=minmax_sca(detail[['amounts','counts']])
print(res)
data=res
bool_id=data.loc[:,'count']==1
print(data.loc[bool_id],'counts')

3.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化

(x-u)/σ

異常值對(duì)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化的影響不大

轉(zhuǎn)化之后的數(shù)據(jù)--->均值0 標(biāo)準(zhǔn)差1

import pandas as pd
import numpy as np
def stand_sca(data):
    """
    標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化
    :param data:傳入的數(shù)據(jù)
    :return:標(biāo)準(zhǔn)化之后的數(shù)據(jù)
    """
    new_data=(data-data.mean())/data.std()
    return new_data
 
#加載數(shù)據(jù)
detail=pd.read_excel('./meal_order_detail.xlsx')
res=stand_sca(detail[['amounts','counts']])
print(res)
print('res的均值:',res.mean())
print('res的標(biāo)準(zhǔn)差:',res.std())

4.小數(shù)定標(biāo)標(biāo)準(zhǔn)化

x/(10^k)
k=math.ceil(log10(max(|x|)))

以10為底,x的絕對(duì)值的最大值的對(duì)數(shù) 最后進(jìn)行向上取整

import pandas as pd
import numpy as np
def deci_sca(data):
    """
    自實(shí)現(xiàn)小數(shù)定標(biāo)標(biāo)準(zhǔn)化
    :param data: 傳入的數(shù)據(jù)
    :return: 標(biāo)準(zhǔn)化之后的數(shù)據(jù)
    """
    new_data=data/(10**(np.ceil(np.log10(data.abs().max()))))
    return new_data
#加載數(shù)據(jù)
detail = pd.read_excel('./meal_order_detail.xlsx')
res = deci_sca(detail[['amounts', 'counts']])
print(res)

補(bǔ)充:pandas數(shù)據(jù)處理基礎(chǔ)之標(biāo)準(zhǔn)化與標(biāo)簽數(shù)值化

fit(): Method calculates the parameters μ and σ and saves them as internal objects.

解釋:簡單來說,就是求得訓(xùn)練集X的均值,方差,最大值,最小值,這些訓(xùn)練集X固有的屬性。

transform(): Method using these calculated parameters apply the transformation to a particular dataset.

解釋:在fit的基礎(chǔ)上,進(jìn)行標(biāo)準(zhǔn)化,降維,歸一化等操作(看具體用的是哪個(gè)工具,如PCA,StandardScaler等)。

fit_transform(): joins the fit() and transform() method for transformation of dataset.

解釋:fit_transform是fit和transform的組合,既包括了訓(xùn)練又包含了轉(zhuǎn)換。 transform()和fit_transform()二者的功能都是對(duì)數(shù)據(jù)進(jìn)行某種統(tǒng)一處理(比如標(biāo)準(zhǔn)化~N(0,1),將數(shù)據(jù)縮放(映射)到某個(gè)固定區(qū)間,歸一化,正則化等)

fit_transform(trainData)對(duì)部分?jǐn)?shù)據(jù)先擬合fit,找到該part的整體指標(biāo),如均值、方差、最大值最小值等等(根據(jù)具體轉(zhuǎn)換的目的),然后對(duì)該trainData進(jìn)行轉(zhuǎn)換transform,從而實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化、歸一化等等。

Note:

必須先用fit_transform(trainData),之后再transform(testData)

如果直接transform(testData),程序會(huì)報(bào)錯(cuò)

如果fit_transfrom(trainData)后,使用fit_transform(testData)而不transform(testData),雖然也能歸一化,但是兩個(gè)結(jié)果不是在同一個(gè)“標(biāo)準(zhǔn)”下的,具有明顯差異。(一定要避免這種情況)

注意:StandardScaler().fit_transform(x,fit_params),fit_params決定標(biāo)準(zhǔn)化的標(biāo)簽數(shù)據(jù),就是每個(gè)標(biāo)準(zhǔn)化的標(biāo)桿數(shù)據(jù),此參數(shù)不同,則每次標(biāo)準(zhǔn)化的過程則不同。

from sklearn import preprocessing
# 獲取數(shù)據(jù)
cols = ['OverallQual','GrLivArea', 'GarageCars','TotalBsmtSF', 'FullBath', 'TotRmsAbvGrd', 'YearBuilt'] ##選取列
x = data_train[cols].values
y = data_train['SalePrice'].values  
x_scaled = preprocessing.StandardScaler().fit_transform(x) ##進(jìn)行歸一化
y_scaled = preprocessing.StandardScaler().fit_transform(y.reshape(-1,1))##先將y轉(zhuǎn)換成一列,再進(jìn)行歸一
 

還有以下形式,和上面的標(biāo)準(zhǔn)化原理一致,都是先fit,再transform。

由ss決定標(biāo)準(zhǔn)化進(jìn)程的獨(dú)特性

# 先將數(shù)據(jù)標(biāo)準(zhǔn)化
from sklearn.preprocessing import StandardScaler
ss = StandardScaler() ##
#用測試集訓(xùn)練并標(biāo)準(zhǔn)化
ss.fit(missing_age_X_train)##首先fit
missing_age_X_train = ss.transform(missing_age_X_train) #進(jìn)行transform
missing_age_X_test = ss.transform(missing_age_X_test)

標(biāo)簽數(shù)值化

1.當(dāng)某列數(shù)據(jù)不是數(shù)值型數(shù)據(jù)時(shí),將難以標(biāo)準(zhǔn)化,此時(shí)要將數(shù)據(jù)轉(zhuǎn)化成數(shù)據(jù)型形式。

數(shù)據(jù)處理前數(shù)據(jù)顯示:

經(jīng)過標(biāo)簽化數(shù)據(jù)處理

from sklearn import preprocessing
f_names = ['CentralAir', 'Neighborhood'] ##需要處理的數(shù)據(jù)標(biāo)簽 
for x in f_names:
    label = preprocessing.LabelEncoder()
    data_train[x] = label.fit_transform(data_train[x]) ##數(shù)據(jù)標(biāo)準(zhǔn)化

處理之后變成:

2.當(dāng)某列有對(duì)應(yīng)的標(biāo)簽值時(shí),即某個(gè)量對(duì)應(yīng)相應(yīng)確定的標(biāo)簽時(shí),例如oldtown就對(duì)應(yīng)1,sawyer就對(duì)應(yīng)2,分類的str轉(zhuǎn)換為序列類這時(shí)使用如下:

數(shù)據(jù)處理之前

利用轉(zhuǎn)換:

title_mapping = {"Mr": 1, "Miss": 2, "Mrs": 3, "Master": 4, "Rare": 5}#將標(biāo)簽對(duì)應(yīng)數(shù)值
train_df['Title'] = train_df['Title'].map(title_mapping)#處理數(shù)據(jù)
train_df['Title'] = train_df['Title'].fillna(0)##將其余標(biāo)簽填充為0值

處理過后:

3.多個(gè)數(shù)據(jù)標(biāo)簽需要分列采用one_hot形式時(shí),處理之前

處理之后

train_test.loc[train_test["Age"].isnull() ,"age_nan"] = 1 ##將標(biāo)簽轉(zhuǎn)換成1
train_test.loc[train_test["Age"].notnull() ,"age_nan"] = 0##將此標(biāo)簽成為0
train_test = pd.get_dummies(train_test,columns=['age_nan']) ##columns決定哪幾行分列處理,prefix參數(shù)是每列前綴

one_hot 形式轉(zhuǎn)變成功。

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • pandas 對(duì)每一列數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的方法
  • pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實(shí)現(xiàn)
  • pandas數(shù)據(jù)處理進(jìn)階詳解
  • Pandas 數(shù)據(jù)處理,數(shù)據(jù)清洗詳解

標(biāo)簽:惠州 鷹潭 上海 常德 黑龍江 四川 益陽 黔西

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《使用pandas模塊實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化操作》,本文關(guān)鍵詞  使用,pandas,模塊,實(shí)現(xiàn),數(shù)據(jù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《使用pandas模塊實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化操作》相關(guān)的同類信息!
  • 本頁收集關(guān)于使用pandas模塊實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化操作的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    日本一区二区三区dvd视频在线| av在线不卡观看免费观看| 日本系列欧美系列| 免费观看在线色综合| 国产偷国产偷亚洲高清人白洁| 亚洲国产电影在线观看| 夜夜精品浪潮av一区二区三区| 久久色.com| 亚洲六月丁香色婷婷综合久久| 亚洲国产精品自拍| 精品在线免费视频| 91视频com| 欧美三级日韩在线| 欧美一区二区三区公司| 日韩精品中午字幕| 中文字幕制服丝袜成人av| 国产精品麻豆视频| 性欧美疯狂xxxxbbbb| 美女尤物国产一区| 免费在线观看一区| aaa亚洲精品| 日韩欧美中文一区| 欧美xfplay| 国产精品国产三级国产普通话蜜臀| 亚洲电影在线免费观看| 国产精品一区三区| 欧美色中文字幕| 2021国产精品久久精品| 亚洲精品中文在线观看| 日本不卡视频在线| 日产精品久久久久久久性色| 国产精品中文欧美| 欧美亚洲综合另类| 国产精品欧美久久久久无广告| 天天av天天翘天天综合网| 一区二区三区中文在线观看| 日本欧美在线观看| 色综合一区二区| 久久久久久亚洲综合影院红桃| 午夜影视日本亚洲欧洲精品| 日本不卡视频在线| 色欧美片视频在线观看| 欧美va亚洲va在线观看蝴蝶网| 亚洲欧洲精品一区二区精品久久久 | 中文字幕第一页久久| 欧美精品第1页| 中文字幕一区二区在线观看| 日韩电影免费在线看| 国产高清无密码一区二区三区| 欧美人与禽zozo性伦| 国产欧美精品一区aⅴ影院 | 一区二区三区不卡在线观看 | 国产精品123区| 精品嫩草影院久久| 日韩精品一区第一页| 精品成人在线观看| 99国产精品国产精品毛片| 亚洲一级在线观看| 精品国产自在久精品国产| 成人性生交大合| 亚洲不卡在线观看| 精品国产伦一区二区三区观看方式| 成人一级黄色片| 亚洲一区二区三区免费视频| 日韩精品一区在线| 91麻豆精品秘密| 美腿丝袜亚洲色图| 日韩理论在线观看| 日韩亚洲电影在线| 成人av在线资源网站| 亚洲精品视频在线| 久久色视频免费观看| 91久久一区二区| 视频一区国产视频| 亚洲精品一卡二卡| 久久久精品人体av艺术| 欧美女孩性生活视频| 成人午夜私人影院| 久久精品国产免费| 五月婷婷另类国产| 国产精品视频免费看| 欧美不卡一区二区三区四区| 日本精品视频一区二区三区| 国产伦理精品不卡| 日韩国产欧美三级| 亚洲综合色网站| 中文字幕亚洲综合久久菠萝蜜| 日韩三级视频在线观看| 欧美少妇性性性| 色综合欧美在线视频区| 成人久久久精品乱码一区二区三区 | 中文字幕成人网| 欧美一区二区三区电影| 色综合色综合色综合| 成人美女视频在线观看18| 免费成人在线视频观看| 午夜视频在线观看一区二区| 国产精品久久久久久久午夜片| 欧美电影影音先锋| 91成人国产精品| 91麻豆国产精品久久| 不卡欧美aaaaa| 国产精品77777竹菊影视小说| 久久国产精品无码网站| 亚洲成人av电影在线| 一区二区在线观看视频在线观看| 欧美白人最猛性xxxxx69交| 欧美福利电影网| 欧美日韩国产美女| 欧美剧情电影在线观看完整版免费励志电影| 国产成人亚洲综合a∨婷婷图片| 国产一区二区在线观看视频| 国产一区二区三区香蕉| 久久99精品久久久久久动态图| 日本欧美一区二区在线观看| 日韩成人免费在线| 日韩中文字幕亚洲一区二区va在线| 亚洲人午夜精品天堂一二香蕉| 自拍偷拍国产精品| 亚洲伊人伊色伊影伊综合网| 一区二区三区免费网站| 亚洲一区二区精品久久av| 午夜欧美视频在线观看| 欧美aⅴ一区二区三区视频| 久久se这里有精品| 国产寡妇亲子伦一区二区| 成人免费观看男女羞羞视频| av在线免费不卡| 欧美日韩日日骚| 精品美女一区二区| 国产精品国产三级国产a | 精品视频一区三区九区| 欧美一区二区二区| 久久综合狠狠综合久久综合88| 久久久国产午夜精品 | 精品少妇一区二区三区日产乱码 | 天天色天天操综合| 国产一区二区0| 色综合久久综合网97色综合| 欧美日韩一级片在线观看| 日韩欧美国产一区在线观看| 日本一区二区免费在线| 一区二区三区四区精品在线视频| 日韩不卡手机在线v区| 国产91对白在线观看九色| 91福利视频久久久久| 欧美成人国产一区二区| 成人免费在线播放视频| 日韩av在线免费观看不卡| 岛国一区二区在线观看| 9191成人精品久久| 国产精品免费视频一区| 日韩av电影天堂| 91香蕉国产在线观看软件| 精品国产sm最大网站| 一区二区三区在线视频观看 | 国产欧美精品日韩区二区麻豆天美| 一区二区三区色| 国产剧情在线观看一区二区| 欧美性高清videossexo| 国产精品欧美一级免费| 免费人成网站在线观看欧美高清| 波多野结衣亚洲| 久久中文娱乐网| 日本亚洲三级在线| 91久久线看在观草草青青| 中文字幕av资源一区| 美女网站色91| 欧美日韩亚洲综合| 中文字幕五月欧美| 国产精品一区二区三区网站| 欧美精品免费视频| 亚洲综合激情网| 91免费小视频| 国产精品网站在线观看| 久久99国内精品| 日韩欧美国产不卡| 亚洲福中文字幕伊人影院| 91亚洲精品乱码久久久久久蜜桃 | 99亚偷拍自图区亚洲| 久久嫩草精品久久久精品| 美女免费视频一区二区| 欧美一区二区视频网站| 亚洲一二三四在线| 欧美无人高清视频在线观看| 中文字幕一区二区三区在线不卡 | 日韩不卡免费视频| 666欧美在线视频| 日日噜噜夜夜狠狠视频欧美人| 91亚洲精华国产精华精华液| 一区在线中文字幕| 色综合久久久久综合| 亚洲欧美综合在线精品| 91性感美女视频| 亚洲欧洲精品成人久久奇米网| av中文字幕在线不卡| 《视频一区视频二区| 色悠悠久久综合| 亚洲一区二区三区自拍| 欧美日韩在线电影|