1. 數(shù)據(jù)的標(biāo)準(zhǔn)化(Standardization):
數(shù)據(jù)的標(biāo)準(zhǔn)化是將數(shù)據(jù)按照一定的數(shù)學(xué)規(guī)則進(jìn)行轉(zhuǎn)換
,使得數(shù)據(jù)滿足特定的標(biāo)準(zhǔn),通常是使數(shù)據(jù)滿足正態(tài)分布或標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)。
標(biāo)準(zhǔn)化的常見方法包括最小-最大標(biāo)準(zhǔn)化
和Z-score標(biāo)準(zhǔn)化
。最小-最大標(biāo)準(zhǔn)化將數(shù)據(jù)映射到[0,1
]的范圍內(nèi),最小-最大標(biāo)準(zhǔn)化將數(shù)據(jù)映射到0-1區(qū)間,公式為(x-min)/(max-min)。而Z-score標(biāo)準(zhǔn)化則根據(jù)數(shù)據(jù)的均值和標(biāo)準(zhǔn)差進(jìn)行轉(zhuǎn)換。z-score標(biāo)準(zhǔn)化將數(shù)據(jù)映射到平均值為0、標(biāo)準(zhǔn)差為1的正態(tài)分布,公式為(x-μ)/σ
標(biāo)準(zhǔn)化主要用于消除不同變量之間的量綱和單位差異,使數(shù)據(jù)具有相同的規(guī)模和量綱,從而能夠更好地進(jìn)行比較和分析。標(biāo)準(zhǔn)化是線性變換,通過數(shù)學(xué)公式將原始數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化的數(shù)據(jù)
。
2. 數(shù)據(jù)的歸一化(Normalization):
數(shù)據(jù)的歸一化是將數(shù)據(jù)縮放到一個(gè)較小的區(qū)間內(nèi)
,通常是[0,1]或[-1,1]的區(qū)間
。歸一化主要關(guān)注的是將數(shù)據(jù)的值壓縮到一個(gè)較小的范圍,以便于處理和分析。歸一化通常用于消除數(shù)據(jù)的尺度或單位差異,使不同變量的數(shù)據(jù)能夠進(jìn)行比較和分析。
歸一化可以通過簡(jiǎn)單的除法或減法實(shí)現(xiàn),即將原始數(shù)據(jù)除以某個(gè)特定的值或減去某個(gè)特定的值,使得結(jié)果落入指定的區(qū)間內(nèi)。與標(biāo)準(zhǔn)化不同,歸一化不關(guān)注數(shù)據(jù)的分布特性
,只關(guān)注將數(shù)據(jù)的值壓縮到一個(gè)較小的范圍。
總結(jié)(數(shù)據(jù)標(biāo)準(zhǔn)化和數(shù)據(jù)歸一化的不同之處和相同之處)
不同
之處:
-
目的
不同。數(shù)據(jù)標(biāo)準(zhǔn)化主要目的是消除量綱影響,數(shù)據(jù)歸一化主要目的是加快模型收斂速度。 -
方法
不同。數(shù)據(jù)標(biāo)準(zhǔn)化常用最小-最大標(biāo)準(zhǔn)化或z-score標(biāo)準(zhǔn)化,數(shù)據(jù)歸一化常用線性轉(zhuǎn)換到固定區(qū)間。 -
影響
不同。數(shù)據(jù)標(biāo)準(zhǔn)化主要影響數(shù)據(jù)的比較,數(shù)據(jù)歸一化主要影響模型訓(xùn)練效果。
相同
之處:
-
都是數(shù)據(jù)預(yù)處理技術(shù)
,目的是對(duì)原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換。 -
都將數(shù)據(jù)映射到
固定范圍內(nèi)
,數(shù)據(jù)標(biāo)準(zhǔn)化
映射到平均值為0、標(biāo)準(zhǔn)差為1,數(shù)據(jù)歸一化
映射到0-1或-1-1區(qū)間。 -
都可以
消除大數(shù)小數(shù)問題
,加強(qiáng)數(shù)據(jù)的可比性。 -
在機(jī)器學(xué)習(xí)模型訓(xùn)練前都常被作為標(biāo)準(zhǔn)步驟使用,目的是為后續(xù)模型訓(xùn)練提供
更好的數(shù)據(jù)分布
。文章來源:http://www.zghlxwxcb.cn/news/detail-812176.html -
轉(zhuǎn)換后的數(shù)據(jù)維度和數(shù)量級(jí)
與原始數(shù)據(jù)一致
,只是進(jìn)行了線性轉(zhuǎn)換,不會(huì)丟失原始數(shù)據(jù)信息
。文章來源地址http://www.zghlxwxcb.cn/news/detail-812176.html
到了這里,關(guān)于不要再搞混標(biāo)準(zhǔn)化與歸一化啦,數(shù)據(jù)標(biāo)準(zhǔn)化與數(shù)據(jù)歸一化的區(qū)別?。〉奈恼戮徒榻B完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!