可視化是一種方便的觀察數(shù)據(jù)的方式,可以一目了然地了解數(shù)據(jù)塊。我們經(jīng)常使用柱狀圖、直方圖、餅圖、箱圖、熱圖、散點圖、線狀圖等。這些典型的圖對于數(shù)據(jù)可視化是必不可少的。除了這些被廣泛使用的圖表外,還有許多很好的卻很少被使用的可視化方法,這些圖有助于完成我們的工作,下面我們看看有那些圖可以進行。
1、平行坐標圖
Parallel Coordinate
我們最多可以可視化 3 維數(shù)據(jù)。但是我們有時需要可視化超過 3 維的數(shù)據(jù)才能獲得更多的信息。我們經(jīng)常使用 PCA 或 t-SNE 來降維并繪制它。在降維的情況下,可能會丟失大量信息。在某些情況下,我們需要考慮所有特征, 平行坐標圖有助于做到這一點。
鳶尾花數(shù)據(jù)集的平行坐標圖
上面的圖片。橫線(平行軸)表示鳶尾花的特征(花瓣長、萼片長、萼片寬、花瓣寬)。分類是Setosa, Versicolor和Virginica。上圖將該物種編碼為Setosa→1,Versicolor→2,Virginica→3。每個平行軸包含最小值到最大值(例如,花瓣長度從1到6.9,萼片長度從4.3到7.9,等等)。例如,考慮花瓣長度軸。這表明與其他兩種植物相比,瀨蝶屬植物的花瓣長度較小,其中維珍屬植物的花瓣長度最高。
有了這個圖,我們可以很容易地獲得數(shù)據(jù)集的總體信息。數(shù)據(jù)集是什么樣子的?讓我們來看看。
讓我們用Plotly Express庫[1]可視化數(shù)據(jù)。Plotly庫提供了一個交互式繪圖工具。
import plotly.express as px
df = px.data.iris()
fig = px.parallel_coordinates(df, color="species_id", labels={"species_id": "Species",
"sepal_width": "Sepal Width", "sepal_length": "Sepal Length",
"petal_width": "Petal Width", "petal_length": "Petal Length", },
color_continuous_scale=px.colors.diverging.Tealrose,
color_continuous_midpoint=2)
fig.show()
除了上圖以外我們還可以使用其他庫,如pandas、scikit-learn和matplotlib來繪制并行坐標。
六邊形分箱圖
Hexagonal Binning
六邊形分箱圖是一種用六邊形直觀表示二維數(shù)值數(shù)據(jù)點密度的方法。
?ax?=?df.plot.hexbin(x='sepal_width',?y='sepal_length',
?????????????????????gridsize=20,color='#BDE320')
文章來源:http://www.zghlxwxcb.cn/news/detail-483728.html
Pandas 允許我們繪制六邊形 binning [2]。我已經(jīng)展示了用于查找 sepal_width 和 sepal_length 列的密度的圖。文章來源地址http://www.zghlxwxcb.cn/news/detail-483728.html
到了這里,關(guān)于幾個實用數(shù)據(jù)可視化圖表Python代碼!的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!