拿到數(shù)據(jù)之后,首先要做的是「探索性數(shù)據(jù)分析」,什么是探索性數(shù)據(jù)分析呢?大致可以分為以下4類:
一維數(shù)據(jù)看看分布和離群值;
二維數(shù)據(jù)看看關(guān)系和趨勢(shì);
三維數(shù)據(jù)看看維度間的兩兩關(guān)系;
高維數(shù)據(jù)降維。
這里需要注意的是,即使剛開(kāi)始拿到的是高維數(shù)據(jù)(這里指的是三維及以上數(shù)據(jù)),也要先進(jìn)行一維數(shù)據(jù)和二維數(shù)據(jù)的探索性數(shù)據(jù)分析,因?yàn)楦呔S數(shù)據(jù)是由一維數(shù)據(jù)或二維數(shù)據(jù)組成的,一維數(shù)據(jù)和二維數(shù)據(jù)的探索性數(shù)據(jù)分析是高維數(shù)據(jù)探索性數(shù)據(jù)分析的基礎(chǔ)。
對(duì)于高維數(shù)據(jù),
我們可以先將高維數(shù)據(jù)拆分成一維數(shù)據(jù),看看各個(gè)一維數(shù)據(jù)的分布和離群值;
再將拆分的一維數(shù)據(jù)兩兩組合成二維數(shù)據(jù),看看各個(gè)二維數(shù)據(jù)的關(guān)系和趨勢(shì);
最后再進(jìn)行高維數(shù)據(jù)的探索性數(shù)據(jù)分析。
「直方圖」是看一維數(shù)據(jù)分布的最常用方法,「箱線圖」是看一維數(shù)據(jù)離群值的最常用方法?!干Ⅻc(diǎn)圖」是看二維數(shù)據(jù)關(guān)系和趨勢(shì)的最常用方法,如果我們只有兩個(gè)變量,我們畫一幅散點(diǎn)圖就可以了。如果我們有n個(gè)變量,那么,我們需要畫很多幅散點(diǎn)圖才可以。如果我們一個(gè)一個(gè)地畫散點(diǎn)圖,那太費(fèi)勁了。偷懶的方法是畫「散點(diǎn)圖矩陣」,那么,怎么畫散點(diǎn)圖矩陣呢?文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-490577.html
示例數(shù)據(jù)集簡(jiǎn)介:gWQS包中有一個(gè)內(nèi)置數(shù)據(jù)集,內(nèi)置數(shù)據(jù)集的名稱叫wqs_data[1],「wqs_data」數(shù)據(jù)集有「34種多環(huán)芳烴暴露數(shù)據(jù)」、25種鄰苯二甲酸酯暴露數(shù)據(jù)和其他類型數(shù)據(jù)。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-490577.html
# 提取wqs_data中前5種多環(huán)芳烴暴露數(shù)據(jù)
PCBs <<
到了這里,關(guān)于R語(yǔ)言:散點(diǎn)圖矩陣的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!