婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > python 機器學習的標準化、歸一化、正則化、離散化和白化

python 機器學習的標準化、歸一化、正則化、離散化和白化

熱門標簽:京華圖書館地圖標注 打印谷歌地圖標注 淮安呼叫中心外呼系統如何 電話外呼系統招商代理 看懂地圖標注方法 蘇州人工外呼系統軟件 佛山通用400電話申請 電話機器人貸款詐騙 廣東旅游地圖標注

       機器學習的本質是從數據集中發現數據內在的特征,而數據的內在特征往往被樣本的規格、分布范圍等外在特征所掩蓋。數據預處理正是為了最大限度地幫助機器學習模型或算法找到數據內在特征所做的一系列操作,這些操作主要包括標準化、歸一化、正則化、離散化和白化等。

1 標準化

       假定樣本集是二維平面上的若干個點,橫坐標 x 分布于區間 [0,100] 內,縱坐標 y 分布于區間 [0,1] 內。顯然,樣本集的 x 特征列和 y 特征列的動態范圍相差巨大,對于機器學習模型(如k-近鄰或 k-means 聚類)的影響也會有顯著差別。標準化處理正是為了避免某一個動態范圍過大的特征列對計算結果造成影響,同時還可以提升模型精度。標準化的實質是對樣本集的每個特征列減去該特征列均值進行中心化,再除以標準差進行縮放。
       Scikit-learn的預處理子模塊preprocessing提供了一個快速標準化函數scale(),使用該函數可以直接返回標準化后的數據集,其代碼如下。

>>> import numpy as np
>>> from sklearn import preprocessing as pp
>>> d = np.array([[ 1., -5., 8.], [ 2., -3., 0.], [ 0., -1., 1.]])
>>> d_scaled = pp.scale(d) # 對數據集d做標準化
>>> d_scaled
array([[ 0. , -1.22474487, 1.40487872],
 [ 1.22474487, 0. , -0.84292723],
 [-1.22474487, 1.22474487, -0.56195149]])
>>> d_scaled.mean(axis=0) # 標準化以后的數據集,各特征列的均值為0
array([0., 0., 0.])
>>> d_scaled.std(axis=0) # 標準化以后的數據集,各特征列的標準差為1
array([1., 1., 1.])

       預處理子模塊 preprocessing 還提供了一個實用類 StandardScaler,它保存了訓練集上各特征列的平均值和標準差,以便以后在測試集上應用相同的變換。此外,實用類StandardScaler 還可以通過 with_mean 和 with_std 參數指定是否中心化和是否按標準差縮放,其代碼如下。

>>> import numpy as np
>>> from sklearn import preprocessing as pp
>>> X_train = np.array([[ 1., -5., 8.], [ 2., -3., 0.], [ 0., -1., 1.]])
>>> scaler = pp.StandardScaler().fit(X_train)
>>> scaler
StandardScaler(copy=True, with_mean=True, with_std=True)
>>> scaler.mean_ # 訓練集各特征列的均值
array([ 1., -3., 3.])
>>> scaler.scale_ # 訓練集各特征列的標準差
array([0.81649658, 1.63299316, 3.55902608])
>>> scaler.transform(X_train) # 標準化訓練集
array([[ 0. , -1.22474487, 1.40487872],
 [ 1.22474487, 0. , -0.84292723],
 [-1.22474487, 1.22474487, -0.56195149]])
>>> X_test = [[-1., 1., 0.]] # 使用訓練集的縮放標準來標準化測試集
>>> scaler.transform(X_test)
array([[-2.44948974, 2.44948974, -0.84292723]])

2 歸一化

       標準化是用特征列的均值進行中心化,用標準差進行縮放。如果用數據集各個特征列的最小值進行中心化后,再按極差(最大值-最小值)進行縮放,即數據減去特征列的最小值,并且會被收斂到區間 [0,1] 內,這個過程就叫作數據歸一化。
       Scikit-learn的預處理子模塊 preprocessing 提供 MinMaxScaler 類來實現歸一化功能。MinMaxScaler 類有一個重要參數 feature_range,該參數用于設置數據壓縮的范圍,默認是 [0,1]。

>>> import numpy as np
>>> from sklearn import preprocessing as pp
>>> X_train = np.array([[ 1., -5., 8.], [ 2., -3., 0.], [ 0., -1., 1.]])
>>> scaler = pp.MinMaxScaler().fit(X_train) # 默認數據壓縮范圍為[0,1]
>>> scaler
MinMaxScaler(copy=True, feature_range=(0, 1))
>>> scaler.transform(X_train)
array([[0.5 , 0. , 1. ],
 [1. , 0.5 , 0. ],
 [0. , 1. , 0.125]])
>>> scaler = pp.MinMaxScaler(feature_range=(-2, 2)) # 設置數據壓縮范圍為[-2,2]
>>> scaler = scaler.fit(X_train)
>>> scaler.transform(X_train)
array([[ 0. , -2. , 2. ],
 [ 2. , 0. , -2. ],
 [-2. , 2. , -1.5]])

       因為歸一化對異常值非常敏感,所以大多數機器學習算法會選擇標準化來進行特征縮放。在主成分分析(Principal Components Analysis,PCA)、聚類、邏輯回歸、支持向量機、神經網絡等算法中,標準化往往是最好的選擇。歸一化在不涉及距離度量、梯度、協方差計算,以及數據需要被壓縮到特定區間時被廣泛使用,如數字圖像處理中量化像素強度時,都會使用歸一化將數據壓縮在區間 [0,1] 內。

3 正則化

       歸一化是對數據集的特征列的操作,而正則化是將每個數據樣本的范數單位化,是對數據集的行操作。如果打算使用點積等運算來量化樣本之間的相似度,那么正則化將非常有用。

       Scikit-learn的預處理子模塊preprocessing提供了一個快速正則化函數normalize(),使用該函數可以直接返回正則化后的數據集。normalize()函數使用參數norm指定I1范式或I2范式,默認使用I2范式。I1 范式可以理解為單個樣本各元素的絕對值之和為 1;I2 范式可理解為單個樣本各元素的平方和的算術根為 1,相當于樣本向量的模(長度)。

>>> import numpy as np
>>> from sklearn import preprocessing as pp
>>> X_train = np.array([[ 1., -5., 8.], [ 2., -3., 0.], [ 0., -1., 1.]])
>>> pp.normalize(X_train) # 使用I2范式正則化,每行的范數為1
array([[ 0.10540926, -0.52704628, 0.84327404],
 [ 0.5547002 , -0.83205029, 0. ],
 [ 0. , -0.70710678, 0.70710678]])
>>> pp.normalize(X_train, norm='I1') # 使用I1范式正則化,每行的范數為1
array([[ 0.07142857, -0.35714286, 0.57142857],
 [ 0.4 , -0.6 , 0. ],
 [ 0. , -0.5 , 0.5 ]])

4 離散化

       離散化(Discretization)是將連續特征劃分為離散特征值,典型的應用是灰度圖像的二值化。如果使用等寬的區間對連續特征離散化,則被稱為 K-bins 離散化。Scikit-learn的預處理子模塊preprocessing提供了Binarizer類和KbinsDiscretizer類來進行離散化,前者用于二值化,后者用于 K-bins 離散化。

>>> import numpy as np
>>> from sklearn import preprocessing as pp
>>> X = np.array([[-2,5,11],[7,-1,9],[4,3,7]])
>>> bina = pp.Binarizer(threshold=5) # 指定二值化閾值為5
>>> bina.transform(X)
array([[0, 0, 1],
 [1, 0, 1],
 [0, 0, 1]])
>>> est = pp.KBinsDiscretizer(n_bins=[2, 2, 3], encode='ordinal').fit(X)
>>> est.transform(X) # 三個特征列離散化為2段、2段、3段
array([[0., 1., 2.],
 [1., 0., 1.],
 [1., 1., 0.]])

5 白化

       白化一詞是從whitening翻譯過來的,難以望文生義,只能從白化后的效果去理解。數據白化有兩個目的,一是去除或降低特征列之間的相關性,二是使得每個特征列的方差為1。顯然,白化的第一個目標就是主成分分析(PCA),通過主成分分析降維,消除方差占比較小的特征維;白化的第二個目標就是標準化。

       白化分為PCA白化和ZCA白化兩種。PCA 白化將原數據各個特征維變換到主成分軸上,消除了特征之間的相關性,并使得各個主成分的方差為1。ZCA白化則是將PCA 白化的結果反變換到原數據的各個特征維軸上,因為ZCA白化過程中通常不會降維。

       Scikit-learn沒有提供專用的白化方法,不過借助成分分析子模塊decomposition提供的PCA 類可以輕松實現PCA白化。PCA類的參數whiten用于設置是否移除特征間的線性關聯,默認值為False。

       假如一位姑娘手頭有一堆相親資料,每位帥哥的信息由年齡、身高、體重、年薪、房產數量、汽車數量等多個特征項組成。通過白化操作,能夠生成一個特征維較小、且可以直接比較樣本間差距的數據集。

>>> import numpy as np
>>> from sklearn import preprocessing as pp
>>> from sklearn.decomposition import PCA
>>> ds = np.array([
    [25, 1.85, 70, 50, 2, 1], 
    [22, 1.78, 72, 22, 0, 1], 
    [26, 1.80, 85, 25, 1, 0],
    [28, 1.70, 82, 100, 5, 2]
]) # 4個樣本,6個特征列
>>> m = PCA(whiten=True) # 實例化主成分分析類,指定白化參數
>>> m.fit(ds) # 主成分分析
PCA(whiten=True)
>>> d = m.transform(ds) # 返回主成分分析結果
>>> d # 特征列從6個降至4個
array([[ 0.01001541, -0.99099492, -1.12597902, -0.03748764],
       [-0.76359767, -0.5681715 ,  1.15935316,  0.67477757],
       [-0.65589352,  1.26928222, -0.45686577, -1.8639689 ],
       [ 1.40947578,  0.28988421,  0.42349164,  1.2724972 ]])
>>> d.std(axis=0) # 顯示各特征列方差
array([0.8660254 , 0.8660254 , 0.8660254 , 1.17790433])
>>> d = pp.scale(d) # 標準化
>>> d.std(axis=0) # 標準化后的各特征列方差均為1
array([1., 1., 1., 1.])

       GitHub上有人提供了ZCA白化的代碼,如果需要,請訪問(https://github.com/mwv/zca)。

以上就是聊聊python 機器學習的標準化、歸一化、正則化、離散化和白化的詳細內容,更多關于python 機器學習的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • 如何基于python實現歸一化處理
  • python數據歸一化及三種方法詳解
  • python實現幾種歸一化方法(Normalization Method)
  • 詳解python實現數據歸一化處理的方式:(0,1)標準化
  • python numpy 按行歸一化的實例
  • Python數據預處理之數據規范化(歸一化)示例
  • python 實現對數據集的歸一化的方法(0-1之間)
  • 對python3 一組數值的歸一化處理方法詳解
  • 基于數據歸一化以及Python實現方式
  • 如何用Pythony驗證萬物歸一(考拉咨猜想)

標簽:駐馬店 江蘇 畢節 中山 湖州 股票 衡水 呼和浩特

巨人網絡通訊聲明:本文標題《python 機器學習的標準化、歸一化、正則化、離散化和白化》,本文關鍵詞  python,機器,學習,的,標準化,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python 機器學習的標準化、歸一化、正則化、離散化和白化》相關的同類信息!
  • 本頁收集關于python 機器學習的標準化、歸一化、正則化、離散化和白化的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    www精品美女久久久tv| 色婷婷综合久久久久中文 | 国产伦精品一区二区三区在线观看| 成人午夜短视频| 久久精品国产亚洲5555| 奇米色777欧美一区二区| 亚洲国产欧美另类丝袜| 亚洲人123区| 亚洲欧美日韩在线不卡| 一级女性全黄久久生活片免费| 欧美手机在线视频| 欧美午夜在线观看| 91麻豆精品国产91久久久久久久久| 日韩专区一卡二卡| 麻豆精品视频在线观看免费| 久久国产成人午夜av影院| 国产久卡久卡久卡久卡视频精品| 国产精品电影一区二区三区| 国产婷婷一区二区| 亚洲欧美日韩久久| 日本女优在线视频一区二区| 国产精品一区二区不卡| 91视视频在线直接观看在线看网页在线看| 亚洲va欧美va国产va天堂影院| 日韩欧美色综合网站| 日韩欧美国产麻豆| 国产精品视频在线看| 亚洲自拍偷拍综合| 男女视频一区二区| 成人夜色视频网站在线观看| jiyouzz国产精品久久| 欧美色图在线观看| 久久免费看少妇高潮| 亚洲欧洲精品一区二区三区| 亚洲伊人伊色伊影伊综合网| 狠狠网亚洲精品| 欧美在线不卡一区| 精品国产99国产精品| 亚洲精品综合在线| 国产综合久久久久影院| 欧美在线999| 久久免费精品国产久精品久久久久| 欧美丰满嫩嫩电影| 最好看的中文字幕久久| 日韩高清在线电影| jizzjizzjizz欧美| 精品国产91洋老外米糕| 一区二区三区色| 国产精品亚洲第一| 欧美精品久久一区| 最新国产精品久久精品| 国产一区二区主播在线| 欧美精选一区二区| 国产精品午夜电影| 黄色资源网久久资源365| 欧美绝品在线观看成人午夜影视| 7777精品伊人久久久大香线蕉完整版 | 中文字幕制服丝袜成人av| 亚洲一区二区三区国产| av不卡在线观看| 国产网红主播福利一区二区| 久久成人综合网| 欧美久久一区二区| 天堂成人国产精品一区| 色婷婷亚洲综合| 久久久噜噜噜久久中文字幕色伊伊| 精品国产伦一区二区三区观看体验 | 国产日韩欧美a| 午夜成人免费电影| 91欧美激情一区二区三区成人| 91亚洲精品久久久蜜桃| 国产欧美日韩不卡| 国产乱子伦一区二区三区国色天香| 免费欧美在线视频| 国产一区二三区好的| 久久电影国产免费久久电影| 日韩精品一区二区三区swag| 亚洲国产一二三| 蜜桃视频在线观看一区二区| 91精品欧美久久久久久动漫| 成人午夜免费视频| 亚洲成a人片在线不卡一二三区| 欧美激情在线一区二区| 欧美一区二区三区视频免费| 成人免费视频国产在线观看| 亚洲欧洲精品成人久久奇米网| 在线成人av影院| 亚洲图片欧美色图| 国产精品视频看| 中文字幕亚洲综合久久菠萝蜜| xnxx国产精品| 91一区二区三区在线观看| 亚洲午夜电影网| 欧美在线视频日韩| 青娱乐精品在线视频| 中文字幕日韩一区| 91 com成人网| 日韩三区在线观看| 欧美日韩国产在线观看| 欧美日韩国产精品成人| 色综合色综合色综合色综合色综合 | 图片区日韩欧美亚洲| 成人av在线一区二区| 中文一区一区三区高中清不卡| 一区二区成人在线视频| 91老师片黄在线观看| 欧美大片在线观看一区二区| 中文字幕一区二| 亚洲综合色在线| 精品午夜一区二区三区在线观看 | 中文天堂在线一区| 久久久国际精品| 亚洲色欲色欲www在线观看| 亚洲亚洲精品在线观看| 成人18视频日本| 在线观看91视频| 日本不卡免费在线视频| 日韩欧美电影在线| 国产成人免费网站| 日韩在线卡一卡二| 欧美韩国一区二区| 日韩精品一区二区在线| 97久久精品人人爽人人爽蜜臀| 精品国精品国产尤物美女| 成人做爰69片免费看网站| 日日骚欧美日韩| 亚洲综合久久久| 中文字幕在线不卡一区 | 色天使久久综合网天天| 久久精品国产亚洲a| 亚洲一区二区三区四区在线| 精品久久国产字幕高潮| 欧美午夜精品一区二区三区 | 美女久久久精品| 亚洲美女视频在线观看| 久久久久久久精| 欧美久久久久久久久久| 在线欧美日韩精品| 岛国精品在线播放| 国产又黄又大久久| 精品在线观看免费| 日本亚洲三级在线| 亚洲成人免费av| 亚洲成人av一区二区| 一区二区三区高清不卡| 国产精品国产成人国产三级| 国产精品网站在线观看| 欧美精品一区二区三区久久久| 亚洲视频在线观看三级| 国产精品嫩草影院av蜜臀| 久久久久久久久久久久电影| 日韩欧美电影一区| 久久久三级国产网站| 久久色视频免费观看| 精品欧美乱码久久久久久1区2区| 床上的激情91.| 精品在线免费观看| 久久精品国产澳门| 国产在线国偷精品产拍免费yy | 一区二区三区精密机械公司| 欧美激情一区二区在线| 欧美videos中文字幕| 国产精品麻豆视频| 欧美伦理影视网| 97se亚洲国产综合自在线不卡| 国产成人午夜电影网| 天天综合色天天综合色h| 中文字幕精品—区二区四季| 精品久久久久99| 这里只有精品免费| 精品欧美一区二区三区精品久久| 精品福利av导航| 精品乱人伦一区二区三区| 韩国v欧美v亚洲v日本v| 久久99蜜桃精品| 丁香婷婷深情五月亚洲| 91浏览器入口在线观看| 777午夜精品免费视频| 久久久久久一二三区| 亚洲欧美经典视频| 免费欧美日韩国产三级电影| 国产精品亚洲第一区在线暖暖韩国| 亚洲欧美激情一区二区| 午夜精品久久久久久久久久久| 久久久.com| 亚洲麻豆国产自偷在线| 精品写真视频在线观看| 欧洲中文字幕精品| 2021国产精品久久精品| 亚洲最色的网站| 久久99久久精品| 日本电影欧美片| 欧美videos中文字幕| 樱花影视一区二区| 精品一区二区三区免费播放| 在线免费观看日本一区| 欧美国产丝袜视频| 日本欧美在线看| 色综合久久天天综合网| 欧美大胆一级视频|