国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

常見的相關(guān)性分析

這篇具有很好參考價(jià)值的文章主要介紹了常見的相關(guān)性分析。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

方差分析和相關(guān)性分析都是描述特征之間的關(guān)系的統(tǒng)計(jì)方法,但它們關(guān)注的方面略有不同。

方差分析主要用于研究一個(gè)或多個(gè)自變量對(duì)因變量的影響,即研究因素之間的差異性。通過比較不同組之間的方差,可以確定哪些因素對(duì)結(jié)果變量的影響比較重要,以及不同組之間的顯著性差異。因此,方差分析可以用于描述特征的重要性程度。
相關(guān)性分析主要用于研究?jī)蓚€(gè)或多個(gè)變量之間的關(guān)系,即研究特征之間的相關(guān)性。通過計(jì)算相關(guān)系數(shù),可以確定不同變量之間的相關(guān)程度,以及變量之間的正相關(guān)或負(fù)相關(guān)關(guān)系。因此,相關(guān)性分析可以用于描述特征間的關(guān)系。

Pearson相關(guān)系數(shù)分析:用于評(píng)估兩個(gè)連續(xù)變量之間的線性關(guān)系。
Spearman秩相關(guān)系數(shù)分析:用于評(píng)估兩個(gè)有序變量之間的關(guān)系,不要求變量之間具有線性關(guān)系。
Kendall秩相關(guān)系數(shù)分析:用于評(píng)估兩個(gè)有序變量之間的關(guān)系,也不要求變量之間具有線性關(guān)系。
判定系數(shù)(R2)分析:用于評(píng)估一個(gè)變量是否能夠解釋另一個(gè)變量的變異。

Pearson相關(guān)系數(shù)分析

Pearson相關(guān)系數(shù)是用于衡量?jī)蓚€(gè)連續(xù)變量之間線性相關(guān)程度的方法。它的取值范圍在-1到1之間,其中0表示沒有相關(guān)關(guān)系,1表示完全正相關(guān),-1表示完全負(fù)相關(guān)。

計(jì)算Pearson相關(guān)系數(shù)的公式為:

r = Σ((x - x?)(y - ?)) / [(Σ(x - x?)2Σ(y - ?)2) ^ 0.5]

其中,x和y是兩個(gè)變量的觀測(cè)值,x?和?是它們的均值。r的取值范圍在-1到1之間,r值越接近1或-1,代表兩個(gè)變量之間的相關(guān)性越強(qiáng);r值越接近0,代表兩個(gè)變量之間沒有相關(guān)性。

Spearman秩相關(guān)系數(shù)分析

Spearman秩相關(guān)系數(shù)是用于評(píng)估兩個(gè)有序變量之間的關(guān)系的方法。它的取值范圍在-1到1之間,其中0表示沒有相關(guān)關(guān)系,1表示完全正相關(guān),-1表示完全負(fù)相關(guān)。

計(jì)算Spearman秩相關(guān)系數(shù)的公式為:

r = 1 - (6Σd2 / n(n2 - 1))

其中,d為兩個(gè)變量的秩次差,n為樣本個(gè)數(shù)。Spearman秩相關(guān)系數(shù)與Pearson相關(guān)系數(shù)類似,但更適用于非正態(tài)分布的數(shù)據(jù)或者兩個(gè)變量之間不是線性關(guān)系的情況。

Kendall秩相關(guān)系數(shù)分析

Kendall秩相關(guān)系數(shù)也是用于評(píng)估兩個(gè)有序變量之間的關(guān)系的方法。它的取值范圍也在-1到1之間,其中0表示沒有相關(guān)關(guān)系,1表示完全正相關(guān),-1表示完全負(fù)相關(guān)。

計(jì)算Kendall秩相關(guān)系數(shù)的公式:
r = (P - Q) / [(n(n-1))/2]

其中,P是兩個(gè)變量的排列一致的對(duì)數(shù),Q是兩個(gè)變量的排列不一致的對(duì)數(shù),n是樣本個(gè)數(shù)。Kendall秩相關(guān)系數(shù)與Spearman秩相關(guān)系數(shù)類似,但更適用于小樣本數(shù)據(jù)和存在相同秩次的情況。

在計(jì)算P和Q時(shí),首先需要將變量的觀測(cè)值從小到大排列,并為每個(gè)觀測(cè)值分配一個(gè)秩次。然后,對(duì)于任意兩個(gè)觀測(cè)值,如果它們?cè)趦蓚€(gè)變量中的秩次一致,則為一致對(duì)數(shù)P加1;如果它們?cè)趦蓚€(gè)變量中的秩次不一致,則為不一致對(duì)數(shù)Q加1。最后,將P和Q代入公式中即可計(jì)算出Kendall秩相關(guān)系數(shù)。文章來源地址http://www.zghlxwxcb.cn/news/detail-675782.html

數(shù)值型變量例子

import pandas as pd
from scipy.stats import pearsonr, spearmanr, kendalltau

# 構(gòu)造樣本數(shù)據(jù)
df = pd.DataFrame({
    'x': [1, 2, 3, 4, 5],
    'y': [3, 5, 7, 9, 11]
})

# 計(jì)算Pearson相關(guān)系數(shù)和p值
pearson_corr, pearson_pvalue = pearsonr(df['x'], df['y'])
print('Pearson相關(guān)系數(shù):', pearson_corr)
print('Pearson p值:', pearson_pvalue)

# 計(jì)算Spearman秩相關(guān)系數(shù)和p值
spearman_corr, spearman_pvalue = spearmanr(df['x'], df['y'])
print('Spearman秩相關(guān)系數(shù):', spearman_corr)
print('Spearman p值:', spearman_pvalue)

# 計(jì)算Kendall秩相關(guān)系數(shù)和p值
kendall_corr, kendall_pvalue = kendalltau(df['x'], df['y'])
print('Kendall秩相關(guān)系數(shù):', kendall_corr)
print('Kendall p值:', kendall_pvalue)
'''
在上面的例子中,我們使用了pandas包創(chuàng)建了一個(gè)包含兩個(gè)變量x和y的DataFrame對(duì)象。
然后,分別使用scipy.stats包中的pearsonr()、spearmanr()和kendalltau()函數(shù)計(jì)算了Pearson、Spearman和Kendall秩相關(guān)系數(shù)以及p值。
最后,將結(jié)果打印出來。

需要注意的是,這些函數(shù)計(jì)算相關(guān)系數(shù)時(shí),會(huì)自動(dòng)排除包含缺失值的樣本。如果數(shù)據(jù)中包含缺失值,需要先進(jìn)行缺失值處理。
'''

文本型變量例子

import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from scipy.stats import pearsonr

# 構(gòu)造樣本數(shù)據(jù)
text_list = [
    'I love Python',
    'Python is the best programming language',
    'Java is another programming language',
    'I dislike Java'
]
df = pd.DataFrame({'text': text_list})

# 使用TF-IDF向量化文本
vectorizer = TfidfVectorizer()
tfidf = vectorizer.fit_transform(df['text'])

# 計(jì)算Pearson相關(guān)系數(shù)和p值
corr, pvalue = pearsonr(tfidf[0].toarray()[0], tfidf[1].toarray()[0])
print('Pearson相關(guān)系數(shù):', corr)
print('p值:', pvalue)
'''
在上面的例子中,我們使用sklearn庫(kù)中的TfidfVectorizer類將文本向量化為TF-IDF向量,
然后使用scipy庫(kù)中的pearsonr()函數(shù)計(jì)算了第一篇文章和第二篇文章之間的Pearson相關(guān)系數(shù)和p值。
需要注意的是,這里只計(jì)算了兩篇文章之間的相關(guān)性,如果需要計(jì)算多篇文章之間的相關(guān)性,可以使用循環(huán)或者矩陣計(jì)算的方法。
'''

到了這里,關(guān)于常見的相關(guān)性分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 機(jī)器學(xué)習(xí)案例:運(yùn)營(yíng)商客戶流失的數(shù)據(jù)分析 #數(shù)據(jù)去重#數(shù)據(jù)分組整合#缺失值處理#相關(guān)性分析#樣本平衡#決策樹、隨機(jī)森林、邏輯回歸

    機(jī)器學(xué)習(xí)案例:運(yùn)營(yíng)商客戶流失的數(shù)據(jù)分析 #數(shù)據(jù)去重#數(shù)據(jù)分組整合#缺失值處理#相關(guān)性分析#樣本平衡#決策樹、隨機(jī)森林、邏輯回歸

    前提: 隨著業(yè)務(wù)快速發(fā)展、電信市場(chǎng)的競(jìng)爭(zhēng)愈演愈烈。如何最大程度地挽留在網(wǎng)用戶、吸取新客戶,是電信企業(yè)最 關(guān)注的問題之一。 客戶流失 會(huì)給企業(yè)帶來一系列損失,故在發(fā)展用戶每月增加的同時(shí),如何挽留和爭(zhēng)取更多 的用戶,也是一項(xiàng)非常重要的工作。 能否利用大數(shù)

    2024年02月08日
    瀏覽(34)
  • 數(shù)據(jù)的特征分析及房?jī)r(jià)增幅與M2增幅的相關(guān)性案例(axis=1為橫向,axis=0為縱向)

    數(shù)據(jù)的特征分析及房?jī)r(jià)增幅與M2增幅的相關(guān)性案例(axis=1為橫向,axis=0為縱向)

    .sort_index()方法在指定軸上根據(jù) 索引 進(jìn)行排序,默認(rèn)升序 .sort_index(axis=0, ascending=True) axis=0 表示的是縱軸 ascending表示是否為遞增排序,默認(rèn)為true ?axis為1 ?這個(gè)by是根據(jù)你哪個(gè)軸的索引進(jìn)行排序? ?NaN統(tǒng)一放到排序末尾 我在學(xué)習(xí)時(shí)經(jīng)常用到axis=0或1,那么axis=0或者1到底是什么

    2023年04月08日
    瀏覽(26)
  • 常見的相關(guān)性分析

    方差分析和相關(guān)性分析都是描述特征之間的關(guān)系的統(tǒng)計(jì)方法,但它們關(guān)注的方面略有不同。 方差分析主要用于研究一個(gè)或多個(gè)自變量對(duì)因變量的影響,即研究因素之間的差異性。通過比較不同組之間的方差,可以確定哪些因素對(duì)結(jié)果變量的影響比較重要,以及不同組之間的顯

    2024年02月11日
    瀏覽(20)
  • 【hive】相關(guān)性函數(shù)進(jìn)行相關(guān)性分析

    在Hive SQL中,使用類似的相關(guān)性函數(shù)進(jìn)行相關(guān)性分析。常見的相關(guān)性函數(shù)包括CORR、COVAR_POP、COVAR_SAMP、STDDEV_POP、STDDEV_SAMP等。 舉個(gè)例子,假設(shè)有一個(gè)表格sales,其中包含兩列數(shù)據(jù) sales_amt 和 advertising_amt ,我們可以使用CORR函數(shù)來計(jì)算這兩列數(shù)據(jù)的相關(guān)性: 這將返回一個(gè)值,表示

    2024年02月21日
    瀏覽(23)
  • 表達(dá)矩陣任意兩個(gè)基因相關(guān)性分析 批量相關(guān)性分析 tcga geo 矩陣中相關(guān)性強(qiáng)的基因?qū)?基因相關(guān)性 ecm matrisome與gpx3

    表達(dá)矩陣任意兩個(gè)基因相關(guān)性分析 批量相關(guān)性分析 tcga geo 矩陣中相關(guān)性強(qiáng)的基因?qū)?基因相關(guān)性 ecm matrisome與gpx3

    使用場(chǎng)景 1.已經(jīng)確定研究的基因,但是想探索他潛在的功能,可以通過跟這個(gè)基因表達(dá)最相關(guān)的基因來反推他的功能,這種方法在英語中稱為 guilt of association,協(xié)同犯罪 。 2.我們的注釋方法依賴于TCGA大樣本,既然他可以注釋基因,那么任何跟腫瘤相關(guān)的基因都可以被注釋,

    2024年02月01日
    瀏覽(23)
  • 相關(guān)性分析和熱圖繪制

    相關(guān)性分析和熱圖繪制

    一、什么是相關(guān)性分析? 相關(guān)性分析是指對(duì)兩個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析,從而衡量?jī)蓚€(gè)變量因素的相關(guān)密切程度。相關(guān)性的元素之間需要存在一定的聯(lián)系或者概率才可以進(jìn)行相關(guān)性分析。在組學(xué)測(cè)序(如轉(zhuǎn)錄組)中需設(shè)置多個(gè)生物學(xué)重復(fù),而對(duì)多個(gè)生物學(xué)重復(fù)

    2024年02月10日
    瀏覽(23)
  • 數(shù)學(xué)建模:相關(guān)性分析

    數(shù)學(xué)建模:相關(guān)性分析

    ?? 文章首發(fā)于我的個(gè)人博客:歡迎大佬們來逛逛 Pearson Spearman Kendall tua-b t檢驗(yàn)(t-test)臨界值表-t檢驗(yàn)表.xls T檢驗(yàn)代碼: myTtest005.m 相關(guān)性分析及SPSS軟件操作.pdf

    2024年02月09日
    瀏覽(25)
  • Pearson相關(guān)性分析& plot繪圖(相關(guān)性系數(shù)柱狀圖、繪制非空值數(shù)量柱狀圖)

    Pearson相關(guān)性分析& plot繪圖(相關(guān)性系數(shù)柱狀圖、繪制非空值數(shù)量柱狀圖)

    Pearson相關(guān)性分析是一種用于檢測(cè)兩個(gè)變量之間線性關(guān)系強(qiáng)度的統(tǒng)計(jì)方法,其結(jié)果介于-1和1之間。一個(gè)相關(guān)系數(shù)為1表示完全正相關(guān),-1表示完全負(fù)相關(guān),0則表示沒有線性關(guān)系。 Pearson相關(guān)性分析假設(shè)數(shù)據(jù)來自正態(tài)分布,并且對(duì)異常值敏感。

    2024年02月09日
    瀏覽(24)
  • 數(shù)學(xué)建模-相關(guān)性分析(Matlab)

    數(shù)學(xué)建模-相關(guān)性分析(Matlab)

    ?注意:代碼文件僅供參考,一定不要直接用于自己的數(shù)模論文中 國(guó)賽對(duì)于論文的查重要求非常嚴(yán)格,代碼雷同也算作抄襲 如何修改代碼避免查重的方法:https://www.bilibili.com/video/av59423231? ?//清風(fēng)數(shù)學(xué)建模 連續(xù)數(shù)據(jù)、正態(tài)分布、線性關(guān)系三者同時(shí)滿足優(yōu)先用。 一般處理這種

    2024年02月07日
    瀏覽(22)
  • Pearson correlation皮爾遜相關(guān)性分析

    Pearson correlation皮爾遜相關(guān)性分析

    在參數(shù)檢驗(yàn)的相關(guān)性分析方法主要是皮爾遜相關(guān)(Pearson correlation)。既然是參數(shù)檢驗(yàn)方法,肯定是有一些前提條件。皮爾遜相關(guān)的前提是必須滿足以下幾個(gè)條件: 變量是連續(xù)變量; 比較的兩個(gè)變量必須來源于同一個(gè)總體; 沒有異常值; 兩個(gè)變量都符合正態(tài)分布。 正態(tài)分布

    2024年02月15日
    瀏覽(29)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包