国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

相關性分析——Pearson相關系數(shù)+熱力圖(附data和Python完整代碼)

這篇具有很好參考價值的文章主要介紹了相關性分析——Pearson相關系數(shù)+熱力圖(附data和Python完整代碼)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

相關性分析:指對兩個或多個具有相關性的變量元素進行分析

1.散點圖和相關性熱力圖

2.相關系數(shù)

相關系數(shù)最早是由統(tǒng)計學家卡爾 皮爾遜設計的統(tǒng)計指標,是研究變量之間線性相關承兌的值,一般用字母 r 表示。

2.1Pearson相關系數(shù)

Pearson相關系數(shù)是衡量兩個數(shù)據(jù)集合是否在一條線上面,用于衡量變量間的線性關系。
python 皮爾遜相關系數(shù),機器學習,python,開發(fā)語言

這里是引用如果有兩個變量:X、Y,最終計算出的相關系數(shù)的含義可以有如下理解:
(1)、當相關系數(shù)為0時,X和Y兩變量無關系。
(2)、當X的值增大(減?。琘值增大(減?。?,兩個變量為正相關,相關系數(shù)在0.00與1.00之間。
(3)、當X的值增大(減?。?,Y值減?。ㄔ龃螅?,兩個變量為負相關,相關系數(shù)在-1.00與0.00之間。

相關系數(shù)的絕對值越大,相關性越強,相關系數(shù)越接近于1或-1,相關度越強,相關系數(shù)越接近于0,相關度越弱。

通常情況下通過以下取值范圍判斷變量的相關強度: 相關系數(shù) 0.8-1.0 極強相關
0.6-0.8 強相關
0.4-0.6 中等程度相關
0.2-0.4 弱相關
0.0-0.2 極弱相關或無相關

2.2 Spearman相關系數(shù)

Spearman相關系數(shù)適用于不符合正態(tài)分布或者總體分布類型未知的數(shù)據(jù),Spearman用于描述兩個變量之間關聯(lián)的程度與方向。

待補充

2.3Kendall等級相關系數(shù)

Kendall等級相關系數(shù)是用于反應分類相關變量的相關指標,適用于兩個變量均為有序分類的情況,對相關的有序變量進行非參數(shù)性相關檢驗。

待補充

3.Python代碼講解

3.1 數(shù)據(jù)集

日期,蜜汁焗餐包,鐵板酸菜豆腐,香煎韭菜餃,香煎羅卜糕,原汁原味菜心
2015/1/1,13,18,10,10,27
2015/1/2,9,19,13,14,13
2015/1/3,8,7,11,10,9
2015/1/4,10,9,13,14,13
2015/1/5,12,17,11,13,14
2015/1/6,8,12,11,5,9
2015/1/7,5,10,8,10,7
2015/1/8,7,6,12,11,5
2015/1/12,0,5,5,7,10
2015/1/13,8,6,9,8,9
2015/1/14,4,8,5,3,10
2015/1/15,8,15,9,13,9
2015/1/16,11,14,9,9,15
2015/1/17,14,16,9,4,14
2015/1/18,9,8,12,9,15
2015/1/19,9,10,6,11,11
2015/1/20,11,8,14,6,13
2015/1/21,7,1,5,12,8
2015/1/22,13,13,5,11,11
2015/1/23,5,8,7,8,11
2015/1/24,7,9,7,10,9
2015/1/25,7,14,7,6,8
2015/1/26,6,9,12,7,5
2015/1/27,12,6,12,9,4
2015/1/28,8,7,12,10,6
2015/1/29,7,8,10,10,11
2015/1/30,7,9,16,10,11
2015/1/31,8,8,10,10,9
2015/2/1,6,6,11,6,9

3.2代碼講解

3.2.1 讀取excel文檔,Pearson相關系數(shù)+熱力圖

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


# 讀取菜品銷售量數(shù)據(jù)
filepath = 'C:/Users/14210/Desktop/機器學習代碼/data/cor.xlsx'
cor = pd.read_excel(filepath) 
# 計算相關系數(shù)矩陣,包含了任意兩個菜品間的相關系數(shù)
print('5種菜品銷售量的相關系數(shù)矩陣為:\n', cor.corr())

# 繪制相關性熱力圖
plt.subplots(figsize=(8, 8))  # 設置畫面大小 
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用來正常顯示中文標簽
plt.rcParams['axes.unicode_minus'] = False  # 用來正常顯示負號 
sns.heatmap(cor.corr(), annot=True, vmax=1, square=True, cmap="Blues") 
plt.title('相關性熱力圖')
plt.show()

3.2.2 結果圖

python 皮爾遜相關系數(shù),機器學習,python,開發(fā)語言

3.2.3 讀取csv文檔,Pearson相關系數(shù)+熱力圖

# 讀取csv文件

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

filepath = 'C:/Users/14210/Desktop/機器學習代碼/data/cor.csv'
data = pd.read_csv(filepath)
df = pd.DataFrame(data)


# 計算出相關系數(shù)并輸出,這里選擇的是皮爾遜相關系數(shù)
cor = data.corr(method='pearson')
print(cor)  # 輸出相關系數(shù)

rc = {'font.sans-serif': 'SimHei',
      'axes.unicode_minus': False}
sns.set(font_scale=0.7,rc=rc)  # 設置字體大小

sns.heatmap(cor,
            annot=True,  # 顯示相關系數(shù)的數(shù)據(jù)
            center=0.5,  # 居中
            fmt='.2f',  # 只顯示兩位小數(shù)
            linewidth=0.5,  # 設置每個單元格的距離
            linecolor='blue',  # 設置間距線的顏色
            vmin=0, vmax=1,  # 設置數(shù)值最小值和最大值
            xticklabels=True, yticklabels=True,  # 顯示x軸和y軸
            square=True,  # 每個方格都是正方形
            cbar=True,  # 繪制顏色條
            cmap='coolwarm_r',  # 設置熱力圖顏色
            )
plt.savefig("我是相關熱力圖.png",dpi=600)#保存圖片,分辨率為600
plt.ion() #顯示圖片

3.2.4 結果圖

python 皮爾遜相關系數(shù),機器學習,python,開發(fā)語言

4.結果分析

根據(jù)熱力圖可以看出,原汁原味菜心鐵板酸菜豆腐、蜜汁煸餐包這兩種菜品的相關性較強,說明大部分客戶對這3種菜品的偏好程度相當。文章來源地址http://www.zghlxwxcb.cn/news/detail-752897.html

到了這里,關于相關性分析——Pearson相關系數(shù)+熱力圖(附data和Python完整代碼)的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!

本文來自互聯(lián)網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 數(shù)據(jù)挖掘01-相關性分析及可視化【Pearson, Spearman, Kendall】

    數(shù)據(jù)挖掘01-相關性分析及可視化【Pearson, Spearman, Kendall】

    ? 有這么一句話在業(yè)界廣泛流傳: 數(shù)據(jù)和特征決定了機器學習的上限,而模型和算法只是逼近這個上限而已。 ? 因此,數(shù)據(jù)挖掘在人工智能和大數(shù)據(jù)的時代下顯得尤為重要。本人在工作中也會經常為數(shù)據(jù)挖掘方面的任務頭疼,所以想將所見、所學、所整理的數(shù)據(jù)挖掘學習資

    2024年02月02日
    瀏覽(21)
  • 【python】求多變量/樣本(矩陣)之間的相關性系數(shù)

    【python】求多變量/樣本(矩陣)之間的相關性系數(shù)

    創(chuàng)作日志: Pearson或Spearson代表的是兩個變量之間的相關性,因此一般輸入是兩個向量(vector),那么當我們有多個變量時,怎樣計算他們兩兩之間的相關性系數(shù)呢?得到的correlation matrix各元素代表的又是什么意思呢? 舉例: 矩陣A有兩個樣本:a1 與 a2,矩陣B有兩個樣本:b1 與

    2024年02月06日
    瀏覽(21)
  • 原生語言操作和spring data中RestHighLevelClient操作Elasticsearch,索引,文檔的基本操作,es的高級查詢.查詢結果處理. 數(shù)據(jù)聚合.相關性系數(shù)打分

    原生語言操作和spring data中RestHighLevelClient操作Elasticsearch,索引,文檔的基本操作,es的高級查詢.查詢結果處理. 數(shù)據(jù)聚合.相關性系數(shù)打分

    ? Elasticsearch 是一個分布式、高擴展、高實時的搜索與數(shù)據(jù)分析引擎。它能很方便的使大量數(shù)據(jù)具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸縮性,能使數(shù)據(jù)在生產環(huán)境變得更有價值。Elasticsearch 的實現(xiàn)原理主要分為以下幾個步驟,首先用戶將數(shù)據(jù)提交到Elasti

    2024年02月05日
    瀏覽(124)
  • Python進行數(shù)據(jù)相關性分析實戰(zhàn)

    Python進行數(shù)據(jù)相關性分析實戰(zhàn)

    平時在做數(shù)據(jù)分析的時候,會要對特征進行相關性分析,分析某些特征之間是否存在相關性。本文將通過一個實例來對數(shù)據(jù)進行相關性分析與展示。 本次分析的是企業(yè)合作研發(fā)模式效果分析,企業(yè)的合作研發(fā)大致分為 企企合作、企學合作、企研合作、企學研合作,也就是企

    2024年02月10日
    瀏覽(18)
  • Spearman 相關性分析法,以及python的完整代碼應用

    Spearman 相關性分析法,以及python的完整代碼應用

    Spearman 相關性分析法是一種針對兩個變量之間非線性關系的相關性計算方法,同時,它不對數(shù)據(jù)的分布進行假設。該方法的基本思想是將兩個(也可以多個)變量的值進行排序,并計算它們之間的等級相關性(Spearman 相關系數(shù))。Spearman 相關系數(shù)的范圍在 -1 到 1 之間,取值為

    2024年02月09日
    瀏覽(17)
  • 基于R、Python的Copula變量相關性分析及AI大模型應用

    在工程、水文和金融等各學科的研究中,總是會遇到很多變量,研究這些相互糾纏的變量間的相關關系是各學科的研究的重點。雖然皮爾遜相關、秩相關等相關系數(shù)提供了變量間相關關系的粗略結果,但這些系數(shù)都存在著無法克服的困難。例如,皮爾遜相關系數(shù)只能反映變量

    2024年04月12日
    瀏覽(29)
  • 【hive】相關性函數(shù)進行相關性分析

    在Hive SQL中,使用類似的相關性函數(shù)進行相關性分析。常見的相關性函數(shù)包括CORR、COVAR_POP、COVAR_SAMP、STDDEV_POP、STDDEV_SAMP等。 舉個例子,假設有一個表格sales,其中包含兩列數(shù)據(jù) sales_amt 和 advertising_amt ,我們可以使用CORR函數(shù)來計算這兩列數(shù)據(jù)的相關性: 這將返回一個值,表示

    2024年02月21日
    瀏覽(23)
  • 表達矩陣任意兩個基因相關性分析 批量相關性分析 tcga geo 矩陣中相關性強的基因對 基因相關性 ecm matrisome與gpx3

    表達矩陣任意兩個基因相關性分析 批量相關性分析 tcga geo 矩陣中相關性強的基因對 基因相關性 ecm matrisome與gpx3

    使用場景 1.已經確定研究的基因,但是想探索他潛在的功能,可以通過跟這個基因表達最相關的基因來反推他的功能,這種方法在英語中稱為 guilt of association,協(xié)同犯罪 。 2.我們的注釋方法依賴于TCGA大樣本,既然他可以注釋基因,那么任何跟腫瘤相關的基因都可以被注釋,

    2024年02月01日
    瀏覽(23)
  • 【100天精通Python】Day57:Python 數(shù)據(jù)分析_Pandas數(shù)據(jù)描述性統(tǒng)計,分組聚合,數(shù)據(jù)透視表和相關性分析

    目錄 1 描述性統(tǒng)計(Descriptive Statistics) 2 數(shù)據(jù)分組和聚合 3 數(shù)據(jù)透視表 4 相關性分析

    2024年02月07日
    瀏覽(44)
  • 常見的相關性分析

    方差分析和相關性分析都是描述特征之間的關系的統(tǒng)計方法,但它們關注的方面略有不同。 方差分析主要用于研究一個或多個自變量對因變量的影響,即研究因素之間的差異性。通過比較不同組之間的方差,可以確定哪些因素對結果變量的影響比較重要,以及不同組之間的顯

    2024年02月11日
    瀏覽(21)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包