国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Pearson相關(guān)性分析& plot繪圖(相關(guān)性系數(shù)柱狀圖、繪制非空值數(shù)量柱狀圖)

這篇具有很好參考價(jià)值的文章主要介紹了Pearson相關(guān)性分析& plot繪圖(相關(guān)性系數(shù)柱狀圖、繪制非空值數(shù)量柱狀圖)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Pearson相關(guān)性分析 & plot繪圖(相關(guān)性系數(shù)柱狀圖、繪制非空值數(shù)量柱狀圖)

1.Pearson相關(guān)性分析

  • Pearson相關(guān)性分析是一種用于檢測(cè)兩個(gè)變量之間線性關(guān)系強(qiáng)度的統(tǒng)計(jì)方法,其結(jié)果介于-1和1之間。一個(gè)相關(guān)系數(shù)為1表示完全正相關(guān),-1表示完全負(fù)相關(guān),0則表示沒(méi)有線性關(guān)系。 Pearson相關(guān)性分析假設(shè)數(shù)據(jù)來(lái)自正態(tài)分布,并且對(duì)異常值敏感。

2.Pearson相關(guān)性分析實(shí)例

# 計(jì)算pearsonr相關(guān)系數(shù)
def calculate_pearsonr(pd):
    head = pd.head().columns.values
    GDM = pd["目標(biāo)變量"].tolist()
    coefficient_of_association = {}
    significance_level = {}
    feature_cnt = {}
    for feature in head:
        if feature != "目標(biāo)變量":
            ftc = 0
            feature_values = pd[feature].tolist()
            GDM_temp, feature_temp, tag = [], [], 0
            for v in feature_values:
                if str(v) != "nan":
                    ftc += 1
                    GDM_temp.append(GDM[tag])
                    feature_temp.append(v)
                tag += 1
            feature_cnt[feature] = ftc
            if len(feature_temp) > 1:
                pc = pearsonr(np.array(feature_temp), np.array(GDM_temp))
                if str(pc[0]) != "nan":
                    ca = pc[0]
                    if ca < -0.0001:
                        ca = ca*-1
                        coefficient_of_association[feature] = ca
                        significance_level[feature] = pc[1]
                    elif ca > 0.0001:
                        coefficient_of_association[feature] = ca
                        significance_level[feature] = pc[1]
    dp_ca = sorted(
        coefficient_of_association.items(),
        key=lambda x: x[1],
        reverse=True)
    print("pearsonr-相關(guān)系數(shù):",dp_ca)
   
    dp_ca_Nempty=[(i[0], feature_cnt[i[0]]) for i in dp_ca]
    print("非空值的數(shù)量:",dp_ca_Nempty)

    return dp_ca

import matplotlib.pyplot as plt
def plot1(dp_ca):
    # 將元組列表轉(zhuǎn)換為字典
    dp_ca_dict = dict(dp_ca)

    # 創(chuàng)建子圖
    # fig, ax = plt.subplots()

    fig = plt.figure(figsize=(16, 10))
    ax = fig.add_subplot(1, 1, 1)

    # 繪制相關(guān)性系數(shù)柱狀圖
    ax.bar(dp_ca_dict.keys(), dp_ca_dict.values())
    ax.set_title('Correlation between Feature and 目標(biāo)變量')
    ax.set_xlabel('Features')
    ax.set_ylabel('Correlation Coefficient')

    # 調(diào)整布局并顯示圖形
    plt.xticks(rotation=45,ha='right') ## # 將x軸標(biāo)簽旋轉(zhuǎn)45度,并以最后一個(gè)字符為旋轉(zhuǎn)中心
    # 設(shè)置x軸刻度標(biāo)簽字體大小為8
    ax.tick_params(axis='x', labelsize=10)

    plt.tight_layout()
    plt.savefig("./Pearson.jpeg")
    plt.show()

if __name__ == '__main__':

    file = pd.read_excel("./filename.xlsx")
    dp_ca=calculate_pearsonr(file)
    plot1(dp_ca)

pearson相關(guān)可視化圖,基礎(chǔ)知識(shí),python,numpy,機(jī)器學(xué)習(xí)

3.plot繪圖(相關(guān)性系數(shù)柱狀圖、繪制非空值數(shù)量柱狀圖)

import matplotlib.pyplot as plt

# 獲取數(shù)據(jù)
dp_ca = [('feature1', 0.8), ('feature2', 0.6), ('feature3', 0.4),('feature4', 0.77), ('feature5', 0.2), ('feature6', 0.4)]
dp_ca_Nempty = [('feature1', 100), ('feature3', 50), ('feature2', 20),('feature4', 70), ('feature5', 10), ('feature6', 26)]

# 將元組列表轉(zhuǎn)換為字典
dp_ca_dict = dict(dp_ca)
dp_ca_Nempty_dict = dict(dp_ca_Nempty)

# 創(chuàng)建子圖
fig, axs = plt.subplots(1, 2, figsize=(10, 5))

# 繪制相關(guān)性系數(shù)柱狀圖
axs[0].bar(dp_ca_dict.keys(), dp_ca_dict.values())
axs[0].set_title('Pearson correlation coefficients')
axs[0].set_xlabel('Features')
axs[0].set_ylabel('Correlation coefficient')

# 繪制非空值數(shù)量柱狀圖
axs[1].bar(dp_ca_Nempty_dict.keys(), dp_ca_Nempty_dict.values())
axs[1].set_title('Number of non-empty values')
axs[1].set_xlabel('Features')
axs[1].set_ylabel('Count')

# 調(diào)整布局并顯示圖形
plt.xticks(rotation=45,ha='right') ## # 將x軸標(biāo)簽旋轉(zhuǎn)45度,并以最后一個(gè)字符為旋轉(zhuǎn)中心

# 設(shè)置x軸刻度標(biāo)簽字體大小為10
axs[0].tick_params(axis='x', labelsize=10)
axs[1].tick_params(axis='x', labelsize=10)

# 調(diào)整布局并顯示圖形
plt.tight_layout()
plt.show()

pearson相關(guān)可視化圖,基礎(chǔ)知識(shí),python,numpy,機(jī)器學(xué)習(xí)文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-707803.html

到了這里,關(guān)于Pearson相關(guān)性分析& plot繪圖(相關(guān)性系數(shù)柱狀圖、繪制非空值數(shù)量柱狀圖)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 數(shù)據(jù)挖掘01-相關(guān)性分析及可視化【Pearson, Spearman, Kendall】

    數(shù)據(jù)挖掘01-相關(guān)性分析及可視化【Pearson, Spearman, Kendall】

    ? 有這么一句話在業(yè)界廣泛流傳: 數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法只是逼近這個(gè)上限而已。 ? 因此,數(shù)據(jù)挖掘在人工智能和大數(shù)據(jù)的時(shí)代下顯得尤為重要。本人在工作中也會(huì)經(jīng)常為數(shù)據(jù)挖掘方面的任務(wù)頭疼,所以想將所見(jiàn)、所學(xué)、所整理的數(shù)據(jù)挖掘?qū)W習(xí)資

    2024年02月02日
    瀏覽(21)
  • 【python】求多變量/樣本(矩陣)之間的相關(guān)性系數(shù)

    【python】求多變量/樣本(矩陣)之間的相關(guān)性系數(shù)

    創(chuàng)作日志: Pearson或Spearson代表的是兩個(gè)變量之間的相關(guān)性,因此一般輸入是兩個(gè)向量(vector),那么當(dāng)我們有多個(gè)變量時(shí),怎樣計(jì)算他們兩兩之間的相關(guān)性系數(shù)呢?得到的correlation matrix各元素代表的又是什么意思呢? 舉例: 矩陣A有兩個(gè)樣本:a1 與 a2,矩陣B有兩個(gè)樣本:b1 與

    2024年02月06日
    瀏覽(21)
  • Matlab進(jìn)階繪圖第14期—相關(guān)性方塊熱圖

    Matlab進(jìn)階繪圖第14期—相關(guān)性方塊熱圖

    相關(guān)性方塊熱圖 是一種特殊的方塊熱圖。 與一般的方塊熱圖相比, 其數(shù)值位于[-1 1]區(qū)間,其顏色用于表示正負(fù),而其方塊的大小用于表示數(shù)值絕對(duì)值的大小 ,可以十分直觀地對(duì)兩個(gè)變量的相關(guān)性進(jìn)行分析。 由于Matlab中未收錄相關(guān)性方塊熱圖的繪制函數(shù),因此需要大家自行

    2023年04月12日
    瀏覽(20)
  • FigDraw 12. SCI 文章繪圖之相關(guān)性矩陣圖(Correlation Matrix)

    FigDraw 12. SCI 文章繪圖之相關(guān)性矩陣圖(Correlation Matrix)

    桓峰基因公眾號(hào)推出基于R語(yǔ)言繪圖教程并配有視頻在線教程,目前整理出來(lái)的教程目錄如下: FigDraw 1. SCI 文章的靈魂 之 簡(jiǎn)約優(yōu)雅的圖表配色 FigDraw 2. SCI 文章繪圖必備 R 語(yǔ)言基礎(chǔ) FigDraw 3. SCI 文章繪圖必備 R 數(shù)據(jù)轉(zhuǎn)換 FigDraw 4. SCI 文章繪圖之散點(diǎn)圖 (Scatter) FigDraw 5. SCI 文章繪

    2023年04月08日
    瀏覽(20)
  • 【hive】相關(guān)性函數(shù)進(jìn)行相關(guān)性分析

    在Hive SQL中,使用類似的相關(guān)性函數(shù)進(jìn)行相關(guān)性分析。常見(jiàn)的相關(guān)性函數(shù)包括CORR、COVAR_POP、COVAR_SAMP、STDDEV_POP、STDDEV_SAMP等。 舉個(gè)例子,假設(shè)有一個(gè)表格sales,其中包含兩列數(shù)據(jù) sales_amt 和 advertising_amt ,我們可以使用CORR函數(shù)來(lái)計(jì)算這兩列數(shù)據(jù)的相關(guān)性: 這將返回一個(gè)值,表示

    2024年02月21日
    瀏覽(23)
  • 表達(dá)矩陣任意兩個(gè)基因相關(guān)性分析 批量相關(guān)性分析 tcga geo 矩陣中相關(guān)性強(qiáng)的基因?qū)?基因相關(guān)性 ecm matrisome與gpx3

    表達(dá)矩陣任意兩個(gè)基因相關(guān)性分析 批量相關(guān)性分析 tcga geo 矩陣中相關(guān)性強(qiáng)的基因?qū)?基因相關(guān)性 ecm matrisome與gpx3

    使用場(chǎng)景 1.已經(jīng)確定研究的基因,但是想探索他潛在的功能,可以通過(guò)跟這個(gè)基因表達(dá)最相關(guān)的基因來(lái)反推他的功能,這種方法在英語(yǔ)中稱為 guilt of association,協(xié)同犯罪 。 2.我們的注釋方法依賴于TCGA大樣本,既然他可以注釋基因,那么任何跟腫瘤相關(guān)的基因都可以被注釋,

    2024年02月01日
    瀏覽(23)
  • 常見(jiàn)的相關(guān)性分析

    方差分析和相關(guān)性分析都是描述特征之間的關(guān)系的統(tǒng)計(jì)方法,但它們關(guān)注的方面略有不同。 方差分析主要用于研究一個(gè)或多個(gè)自變量對(duì)因變量的影響,即研究因素之間的差異性。通過(guò)比較不同組之間的方差,可以確定哪些因素對(duì)結(jié)果變量的影響比較重要,以及不同組之間的顯

    2024年02月11日
    瀏覽(21)
  • 相關(guān)性分析和熱圖繪制

    相關(guān)性分析和熱圖繪制

    一、什么是相關(guān)性分析? 相關(guān)性分析是指對(duì)兩個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析,從而衡量?jī)蓚€(gè)變量因素的相關(guān)密切程度。相關(guān)性的元素之間需要存在一定的聯(lián)系或者概率才可以進(jìn)行相關(guān)性分析。在組學(xué)測(cè)序(如轉(zhuǎn)錄組)中需設(shè)置多個(gè)生物學(xué)重復(fù),而對(duì)多個(gè)生物學(xué)重復(fù)

    2024年02月10日
    瀏覽(23)
  • 數(shù)學(xué)建模:相關(guān)性分析

    數(shù)學(xué)建模:相關(guān)性分析

    ?? 文章首發(fā)于我的個(gè)人博客:歡迎大佬們來(lái)逛逛 Pearson Spearman Kendall tua-b t檢驗(yàn)(t-test)臨界值表-t檢驗(yàn)表.xls T檢驗(yàn)代碼: myTtest005.m 相關(guān)性分析及SPSS軟件操作.pdf

    2024年02月09日
    瀏覽(25)
  • 原生語(yǔ)言操作和spring data中RestHighLevelClient操作Elasticsearch,索引,文檔的基本操作,es的高級(jí)查詢.查詢結(jié)果處理. 數(shù)據(jù)聚合.相關(guān)性系數(shù)打分

    原生語(yǔ)言操作和spring data中RestHighLevelClient操作Elasticsearch,索引,文檔的基本操作,es的高級(jí)查詢.查詢結(jié)果處理. 數(shù)據(jù)聚合.相關(guān)性系數(shù)打分

    ? Elasticsearch 是一個(gè)分布式、高擴(kuò)展、高實(shí)時(shí)的搜索與數(shù)據(jù)分析引擎。它能很方便的使大量數(shù)據(jù)具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸縮性,能使數(shù)據(jù)在生產(chǎn)環(huán)境變得更有價(jià)值。Elasticsearch 的實(shí)現(xiàn)原理主要分為以下幾個(gè)步驟,首先用戶將數(shù)據(jù)提交到Elasti

    2024年02月05日
    瀏覽(123)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包