全文鏈接:https://tecdat.cn/?p=33514
綜合社會調(diào)查(GSS)是由國家輿論研究中心開展的一項觀察性研究。自 1972 年以來,GSS 一直通過收集當代社會的數(shù)據(jù)來監(jiān)測社會學和態(tài)度趨勢。其目的是解釋態(tài)度、行為和屬性的趨勢和常量。從 1972 年到 2004 年,GSS 的目標人群是居住在家庭中的成年人(18 歲以上)(點擊文末“閱讀原文”獲取完整代碼數(shù)據(jù))。
相關視頻
本篇文章旨在幫助客戶使用R語言對GSS數(shù)據(jù)進行自舉法bootstrap統(tǒng)計推斷、假設檢驗以及探索性數(shù)據(jù)分析可視化。首先,我們將簡要介紹GSS數(shù)據(jù)集的特點和背景。然后,我們將詳細說明自舉法bootstrap的原理和應用,以及如何利用R語言進行自舉法bootstrap分析。接著,我們將探討假設檢驗的概念和步驟,并展示如何使用R語言進行假設檢驗分析。最后,我們將介紹數(shù)據(jù)可視化的重要性,并演示如何使用R語言生成圖表和可視化結果。
第 1 部分:數(shù)據(jù)
1994 年以前,全球住戶抽樣調(diào)查幾乎每年進行一次(1979 年、1981 年或 1992 年因資金限制除外)。此后,全球抽樣調(diào)查在偶數(shù)年進行,采用雙重抽樣設計。這主要是通過面對面的訪談完成的。2002 年,全球抽樣調(diào)查開始使用計算機輔助個人訪談(CAPI)。此外,當難以安排與被抽樣調(diào)查對象進行面對面面談時,也會通過電話進行面談。從 1972 年到 1974 年的調(diào)查中,采用了修正概率抽樣法(整群配額抽樣法)。從 1975 年到 2002 年,全球住戶抽樣調(diào)查采用了完全概率住戶抽樣,使每個住戶被納入調(diào)查的概率相等。因此,全球住戶抽樣調(diào)查對住戶一級的變量進行了自加權。為了保持設計的無偏性,全球住戶抽樣調(diào)查開始采用兩階段子抽樣設計。
加載數(shù)據(jù)
load("C:/gs.data")
第2部分:研究問題
我們想了解工作滿意度與受訪者是自營職業(yè)者還是為他人工作之間是否存在關系。我們的分析將側重于《政府統(tǒng)計調(diào)查》報告。為此,我們將回答以下問題:
對自己的工作感到滿意的個體經(jīng)營者和對自己的工作感到滿意的個體經(jīng)營者的人口比例是否存在差異?
對工作非常滿意的自雇人的平均家庭收入(經(jīng)通貨膨脹調(diào)整后)是否高于對工作非常滿意的為他人工作的人?
對工作非常滿意的自營職業(yè)人和對工作非常滿意的為他人工作的人的典型家庭收入(如果與平均家庭收入不同)是多少?兩者的典型家庭收入是否存在差異?興趣:就我個人而言,由于我做出了轉行的決定,我一直在想,工作滿意度是取決于就業(yè)狀況,還是僅僅取決于所從事工作的性質,而不論是為他人工作還是自營職業(yè)。此外,出于好奇,我還想知道自營職業(yè)者和為他人工作的成年人對工作真正滿意的平均/典型家庭收入。
第 3 部分:探索性數(shù)據(jù)分析
在本分析中,我們將剔除所有缺失結果(所有 NA)。為便于分析
gssc <- gss %>%
filter(year == "2012") %>%
select(satjob, wrkslf, coninc, income06)
使用 summary(gssc) 查看數(shù)據(jù)摘要,使用 str(gssc) 查看數(shù)據(jù)結構。了解變量的組成值(類型和結構)將有助于我們進行分析。
str(gssc)
文章來源地址http://www.zghlxwxcb.cn/news/detail-685479.html
summary(gssc)
文章來源:http://www.zghlxwxcb.cn/news/detail-685479.html
為了回答我們的研究問題,我們希望了解自營職業(yè)受訪者以及為他人工作的受訪者中對其工作感到滿意(非常滿意和比較滿意)和不滿意(非常不滿意和有點不滿意)的人數(shù)和比例。
首先,我們要找到計數(shù):
gssc %>%
filter(!is.na(wrkslf), !is.na(satjob)) %>%
group_by(wrkslf) %>%
count(satjob)
然后,我們利用上述結果創(chuàng)建一個或然率表。
conting.table <- as.table(conting)
conting.table
我們可以使用鑲嵌圖和柱狀圖來直觀地顯示上述結果。
mosaicplot(conting
color = "skyblue")
點擊標題查閱往期內(nèi)容
R語言空氣污染數(shù)據(jù)的地理空間可視化和分析:顆粒物2.5(PM2.5)和空氣質量指數(shù)(AQI)
左右滑動查看更多
01
02
03
04
gssc %>%
filter(!is.na(satjob), !is.na(wrkslf)) %>%
ggp.y = element_blank(), axis.ticks.y = element_blank())
超過 50%的個體經(jīng)營者對自己的工作非常滿意,約 50%的為他人工作的人也對自己的工作非常滿意。
conting.table %>%
prop.ta
round(3)
自雇受訪者中對工作非常不滿意的比例很低,僅為 1.3%,而為他人工作的受訪者中有 3.4% 對工作非常不滿意。
對工作滿意的自雇人與對工作滿意的為他人工作的人的比例
gssc <- gssc %>%
mutate(lsatjob =
gssc %>%
filter(!is.n
我們感興趣的是對工作滿意的自雇受訪者和為他人工作的受訪者的比例。
gssc %>%
filter(!is.na(wrkslf),= "Satisfied")/n())
收入、就業(yè)狀況與工作滿意度之間的關系
在為他人工作的受訪者和自營職業(yè)者中,對工作感到滿意的人占很大比例。我們將研究收入水平與就業(yè)狀況(自營職業(yè)和為他人工作)對工作滿意度的關系。正如我們在研究問題中指出的,我們的重點是對工作非常滿意的受訪者的平均家庭收入。
Plot1 <- gssc %>%
filter(wrkslf == "Self-Employed", !is.na(satjob), !is.na(income06)) %>%
grid.arrange(Plot1, Plot2, ncol = 2,
從柱狀圖中我們可以看出,對于兩種就業(yè)狀況的受訪者而言,隨著家庭總收入水平的增加,對工作非常滿意和一般滿意的受訪者人數(shù)都在增加,只有少數(shù)人對工作 "有點不滿意"(收入在 11 萬美元以上的自雇受訪者除外)。
讓我們更清楚地了解家庭總收入中對工作非常滿意的自營職業(yè)受訪者和為他人工作的受訪者。
gssc %>%
filter(satjob == "Very Satis), axis.ticks.x = element_blank())
我們希望評估對工作非常滿意的兩種就業(yè)狀況下的平均家庭收入(通貨膨脹調(diào)整后)。為此,我們繪制了直方圖和方框圖,并進行了匯總統(tǒng)計,以確定數(shù)據(jù)的形狀、中心和變異性。
請記住,在 155 名自營職業(yè)受訪者中,有 97 人對自己的工作非常滿意;在 1276 名為他人工作的受訪者中,有 626 人對自己的工作非常滿意(見上文的或然率表)。
p3 <- gssc %>%
filter(satjob == "Very Satisfied", wrkslf == "Self-Employed", !is.na(coninc)) %>%
兩個樣本分布都向右強烈傾斜,典型的家庭收入將是分布的中位數(shù)。IQR 可以最好地解釋這兩個分布的變異性。
我們繪制一個方框圖來直觀顯示樣本的情況:
gssc %>%
filter(satjob ==
如前所述,這兩個分布均呈強烈的右偏態(tài),離群值均高于 150 000 元。
讓我們對這兩個樣本進行匯總統(tǒng)計。
gssc %>%
filter(satjob == "Very Satisfied",
nc, 0.75))
gssc %>%
filter(satjob == "Very
對工作非常滿意的自雇人士的典型家庭收入為 51 705 元,家庭收入變數(shù)為 70 855 元。收入較低的 25% 的人的收入為 21,065 元,75% 的人的收入為 91,920 元。他們的平均家庭收入為 70,911.8元。
gssc %>%
filter(satjob
count(wrkslf)
為他人工作的人對自己的工作非常滿意,其典型家庭收入為 42,130 元,家庭收入變數(shù)為 55,535 元,低于自營職業(yè)的人。他們中收入最低的 25%的人的收入為 21 065 元(與自雇者相同),75%的人的收入為 76 600 元,低于自雇者。他們的平均家庭收入為 56 165.08 元。
在下一節(jié)中,我們將了解對工作非常滿意的個體經(jīng)營者的平均家庭收入是否高于為他人工作且對工作非常滿意的個體經(jīng)營者的平均家庭收入。我們還將進行假設檢驗,以估計他們的典型收入是否存在差異。
第 4 部分:推斷
工作滿意度與就業(yè)狀況之間的關系(自營職業(yè)者和為他人工作的受訪者) 為了回答 "工作滿意度與就業(yè)狀況之間是否存在關系 "這一問題,我們將對其獨立性進行卡方檢驗(對于兩個分類變量,至少有 1 個大于 2 個水平的變量)。
我們將定義檢驗假設:H0(什么也沒發(fā)生):工作滿意度和就業(yè)狀況是獨立的。工作滿意度不會因受訪者的就業(yè)狀況而變化。HA(有事發(fā)生):工作滿意度和就業(yè)狀況互為因果。工作滿意度確實因受訪者的就業(yè)狀況而異。然后,檢查是否存在以下條件
chisq<- chisq.t
chisq
在 5%的顯著水平上,P 值小于 0.05,因此我們拒絕 H0。因此,數(shù)據(jù)提供了令人信服的證據(jù),表明工作滿意度確實因受訪者的就業(yè)狀況而異,但我們還需要確認所有預期計數(shù)是否都有至少 5 個案例。
#Expected Counts
chisq$expected
對工作非常不滿意的自雇受訪者的預期人數(shù)比 5 人少 0.13 人。我們可以忽略它,因為它近似于 5(顯著性數(shù)字),它只是一個單元格,而我們的數(shù)據(jù)是一個 2 乘 4 的表格,我們可以接受上面的卡方檢驗結果,但我們有可能出現(xiàn)類型 1 錯誤(拒絕零假設,而實際上零假設是真的)。我們可以繼續(xù)使用推論函數(shù)進行詳細的卡方分析,或者為了更確定結果,將最后兩行折疊為 "不滿意 "行,然后進行推論檢驗,或者直接使用自舉檢驗。我們將采用后兩種建議,以確保滿足樣本量條件并減少類型 1 錯誤。
bootstrap自舉法
由于上述原因,我們將使用引導法來檢驗我們的假設,即就業(yè)狀況和工作滿意度是相關的。
gssc %>%
alternative = "greater", boot_method = "perc", nsim = 15000)
由于 p 值低于 0.05,我們拒絕零假設,從而證實了上述皮爾遜卡方檢驗的結論。我們將繼續(xù)使用建議中的另一種方法來確認我們的結果。
因預期計數(shù)小于 5 而折疊單元格
創(chuàng)建一個新變量 csatjob 并添加到數(shù)據(jù)幀 gssc 中。
gssc <- gssc %>%
Satisfied", "Dissatisfied")))
找出觀察到的計數(shù)。預期計數(shù)和或然率表將顯示在我們的 "推斷 "結果中。
gssc %>%
filter(!is.na(wrkslf), !is.na(csatjob)) %>%
group_by(wrkslf) %>%
count(csatjob)
因此,我們將繼續(xù)進行假設檢驗,即由于所有條件都已滿足,就業(yè)狀況和工作滿意度在 5%的顯著性水平上存在關聯(lián)。
gssc %>%
filter(!i
alternative = "greater")
?p 值小于我們之前的結果,因此減少了類型 1 錯誤的可能性。因此,在 5%的顯著水平上,p 值小于 0.05,所以我們拒絕 H0。因此,數(shù)據(jù)提供了令人信服的證據(jù),證明工作滿意度和就業(yè)狀況如前所述是相互依賴的。
對工作感到滿意的自營職業(yè)者與對工作感到滿意的為他人工作者之間的差異
我們想了解對自己的工作感到滿意的自雇人與對自己的工作感到滿意的為他人工作的人之間的人口比例是否存在差異。請點擊查看上面的數(shù)據(jù)。
從我們的數(shù)據(jù)來看,91.6% 的自雇受訪者對自己的工作感到滿意,87.1% 的為他人工作的受訪者對自己的工作感到滿意。
首先,我們將使用 95% 的置信區(qū)間來估計差異。
相關參數(shù):對工作感到滿意的所有自雇人與對工作感到滿意的為他人工作的人之間的差異。
點估計值:對工作感到滿意的(抽樣)自雇受訪者與對工作感到滿意的(抽樣)為他人工作的受訪者之間的差異。
我們檢查是否滿足比較兩個獨立比例的條件。
獨立性:隨機抽樣:兩個人群都是隨機抽樣的;10% 的受訪者對工作滿意。
gssc %>%
filter(!is.na(lsatj
我們有 95% 的把握認為,對工作感到滿意的自雇人的總體比例比對工作感到滿意的為他人工作的人的總體比例少 0.27% 到多 9.2%。
那么,根據(jù)我們上面計算出的置信區(qū)間,我們是否應該預期在對工作感到滿意的廣大自雇人和對工作感到滿意的為他人工作的人的人口比例之間會發(fā)現(xiàn)顯著差異(在同等顯著性水平下)?
p自營職業(yè)者 - p其他人 = (-0.0027 , 0.092)
H0:p自營職業(yè)者 - 其他人
空值包含在區(qū)間內(nèi),因此我們無法拒絕 H0。因此,上述問題的答案是否定的。從我們的數(shù)據(jù)來看,對自己的工作感到滿意的自雇人和對自己的工作感到滿意的為他人工作的人之間的人口比例沒有顯著差異。
我們將通過在 5%的顯著性水平上進行假設檢驗來確認上述結果,以評估對工作滿意的自雇人和對工作滿意的為他人工作的人之間是否存在差異。
讓我們?yōu)闄z驗定義假設:
H0:p自雇=p其他人。
對工作滿意的自雇人與對工作滿意的為他人工作的人的人口比例相同。
HA: p= p其他人。
對工作滿意的自雇人與對工作滿意的為他人工作的人的人口比例存在差異。
然后,檢查是否滿足進行假設檢驗(比較兩個比例)的推理條件:
獨立性:組內(nèi)滿足:隨機抽樣:兩個人群都是隨機抽樣;兩個人群都滿足 10%的條件。因此,對工作滿意的自雇抽樣受訪者相互獨立,而對工作滿意的為他人工作的受訪者(抽樣)也相互獨立:我們預計對工作滿意的自雇抽樣受訪者和對工作滿意的為他人工作的受訪者(抽樣)不會相互依賴。
樣本大小/偏斜:我們需要集合比例來檢查成功-失敗條件(成功條件- n*p^pool >= 10,失敗條件- n(1 - p^pool) >= 10)。
phat_pool
155 * phat_pool
155 * (1 - phat_pool)
# Someone else: success
1276 * phat_pool
1276 * (1 - phat_pool)
自營職業(yè)者和其他人都符合抽樣規(guī)模/偏斜條件。我們可以假定,兩個比例之差的抽樣分布接近正態(tài)。
因此,我們可以繼續(xù)進行假設檢驗,因為所有條件都已滿足。
gssc %>%
filter(!is.na(lsatjob), !is.na(wrkslf)) %>%
inference(y = lsatjob, x = wrkslf, type = "ht", statistic = "proportion", success = "Satisfied",
method = "theoretical", alternative = "twosided")
p 值大于 0.05,因此我們無法拒絕零假設。數(shù)據(jù)沒有提供強有力的證據(jù)表明,對工作滿意的個體經(jīng)營者與對工作滿意的個體經(jīng)營者的人口比例不同。這與置信區(qū)間法得出的結論一致。
對工作非常滿意的自雇人和對工作非常滿意的為他人工作的人的平均和典型家庭收入的差異。
我們想了解對工作非常滿意的自雇人的平均家庭收入(經(jīng)通脹調(diào)整后)實際上是否高于為他人工作且對工作非常滿意的人。請點擊查看以上數(shù)據(jù)。
根據(jù)我們的數(shù)據(jù),對工作非常滿意的自雇受訪者的平均家庭收入為 70,911.8 元,而為他人工作且對工作非常滿意的受訪者的平均家庭收入為 56,165.08 元。
首先,我們將使用 90% 的置信區(qū)間來估計差異。我們選擇 90% 的置信區(qū)間是為了使我們的研究結果與假設檢驗一致,而假設檢驗在 5% 的顯著水平下是單側的。
相關參數(shù):對工作非常滿意的所有自雇人士與對工作非常滿意的為他人工作的自雇人士的平均家庭收入之差。
點估計值:對工作非常滿意的抽樣自雇人與對工作非常滿意的(抽樣)為他人工作的人的平均家庭收入之差。
我們檢查是否滿足比較兩個獨立均值的條件。
獨立性:組內(nèi)滿足:隨機抽樣:兩個人群都是隨機抽樣;兩個人群都滿足 10% 的條件。因此,對工作滿意的自雇受訪者和對工作滿意的為他人工作的受訪者(樣本)的家庭收入是相互獨立的:兩組之間相互獨立(非配對)。
樣本大小/偏斜:兩個分布都向右強烈傾斜;81 和 578 的樣本量使得使用 t 分布對每個均值分別建模是合理的。
所有條件都已滿足,因此我們將使用 90% 的置信區(qū)間來估計差異。
gssc %>%
filter(satjob == "
根據(jù)上述結果,我們有 90% 的把握認為,對工作非常滿意的廣大自雇人的平均家庭收入(經(jīng)通脹調(diào)整后)比對工作非常滿意的為他人工作的人的平均家庭收入多 2,635.08 元至 26,858.36 元。
那么,根據(jù)上述我們計算出的置信區(qū)間,我們是否應該預計對工作非常滿意的廣大自雇人和對工作非常滿意的為他人工作的人的平均家庭收入之間存在顯著差異(在同等顯著性水平下)?
自營職業(yè)者 - 為他人工作者 = (2635.0838 , 26858.362)
該值不在置信區(qū)間內(nèi);我們拒絕 H0。因此,上述問題的答案是肯定的。從我們的數(shù)據(jù)來看,對工作非常滿意的自雇人的平均家庭收入高于對工作非常滿意的為他人工作的人的平均家庭收入。
我們將在 5%的顯著性水平上進行假設檢驗,以評估對工作非常滿意的個體經(jīng)營者的平均家庭收入是否高于對工作非常滿意的為他人工作的個體經(jīng)營者的平均家庭收入,從而證實上述結果。
讓我們定義一下檢驗假設:
H0:自營職業(yè)者 = 為他人工作者。對工作非常滿意的自雇人的平均家庭收入高于為他人工作且對工作非常滿意的自雇人。
HA:自營職業(yè)者 > 為他人工作者。對工作非常滿意的自雇人的平均家庭收入高于對工作非常滿意的為他人工作的人的平均家庭收入。
比較兩個獨立均值的推論條件已經(jīng)滿足,因此我們繼續(xù)進行假設檢驗。
gssc %>%
filter(satjob =
p 值小于 0.05,因此我們拒絕零假設。數(shù)據(jù)提供了令人信服的證據(jù),表明對工作非常滿意的個體經(jīng)營者的平均家庭收入高于為他人工作且對工作非常滿意的個體經(jīng)營者。這與置信區(qū)間法得出的結論一致。
對工作非常滿意的自雇人與對工作非常滿意的為他人工作的人的典型家庭收入對比
如前所述,典型家庭收入就是收入中位數(shù)。因此,我們將使用 Bootstrap 方法(用于比較中位數(shù))來估計對工作非常滿意的自雇人和對工作非常滿意的為他人工作的人的典型家庭收入是否存在差異。
根據(jù)我們的數(shù)據(jù),對工作非常滿意的自雇受訪者的典型家庭收入為 51 705 元,而為他人工作且對工作非常滿意的受訪者的典型家庭收入為 42 130 元。
我們將用 95%的置信區(qū)間來估計典型家庭收入的差異,并用標準誤差法進行 5%顯著水平的假設檢驗。如前所述,所有條件均已滿足。
相關參數(shù):對工作非常滿意的所有個體經(jīng)營者的典型家庭收入之差
點估計值:被抽樣調(diào)查的對工作非常滿意的自雇人的典型家庭收入與被抽樣調(diào)查的對工作非常滿意的為他人工作的人的典型家庭收入之間的差異。
95% 置信區(qū)間的bootstrap引導法
gssc %>%
filter(satjob =
nsim = 15000, boot_method = "se")
根據(jù)上述結果,我們有 95% 的把握認為,對工作非常滿意的廣大自雇人的典型家庭收入(經(jīng)通脹調(diào)整后)比對工作非常滿意的為他人工作的人少 4,583.73 元,多 23,733.73 元。
那么,根據(jù)上述我們計算出的置信區(qū)間,我們是否應該期望在對工作非常滿意的廣大自雇人和對工作非常滿意的為他人工作的人的平均家庭收入之間發(fā)現(xiàn)顯著差異(在同等顯著性水平下)?
Pop_medianself-employed - Pop_mediansomeone else = (-4583.7323 , 23733.7323)
H0:Pop_median-self-employed - Pop_medsomeone else = 0。
0 在置信區(qū)間內(nèi);我們無法拒絕 H0。因此,上述問題的答案是否定的。從我們的數(shù)據(jù)來看,對自己的工作非常滿意的廣大自雇人和對自己的工作非常滿意的為他人工作的人的典型家庭收入之間沒有顯著差異。
我們將在 5%的顯著性水平上進行假設檢驗,利用 Bootstrap 方法來評估對工作非常滿意的自雇人和對工作非常滿意的為他人工作的人的典型家庭收入是否存在差異,從而證實上述結果。
讓我們定義一下檢驗假設:
H0:Pop_med-self-employed = Pop_medsomeone else。對工作非常滿意的自雇人與對工作非常滿意的為他人工作的人的典型家庭收入相同。
HA: Pop_med-self-employed != Pop_medsomeone else。對工作非常滿意的自雇人與對工作非常滿意的為他人工作的人的典型家庭收入存在差異。
gssc %>%
filter(satjob =, nsim = 15000, boot_method = "se")
p 值大于 0.05,因此我們無法拒絕零假設。數(shù)據(jù)沒有提供強有力的證據(jù)表明,對工作非常滿意的個體經(jīng)營者的典型家庭收入與為他人工作且對工作非常滿意的個體經(jīng)營者的典型家庭收入有所不同。這與上文(自舉bootstrap法)置信區(qū)間法得出的結論一致。
第五部分:結論
經(jīng)過分析和推論,我們對 2012 年得出以下結論(如每個推論后所述):
數(shù)據(jù)提供了令人信服的證據(jù),表明工作滿意度確實因受訪者的就業(yè)狀況(自營職業(yè)和為他人工作)而異。它們之間存在依賴關系。
數(shù)據(jù)沒有提供有力證據(jù)表明,對工作滿意的自雇人與對工作滿意的為他人工作的人的人口比例不同。
數(shù)據(jù)提供了令人信服的證據(jù),證明對工作非常滿意的自雇人的平均家庭收入高于對工作非常滿意的為他人工作的人的平均家庭收入。4 數(shù)據(jù)沒有提供有力證據(jù)表明,對工作非常滿意的自雇人的典型家庭收入與為他人工作且對工作非常滿意的人的典型家庭收入不同。
參考資料
David M Diez, Christopher D Barr and Mine Cetinkaya-Rundel. "OpenIntro Statistics, Third Edition". (2016).
本文中分析的數(shù)據(jù)分享到會員群,掃描下面二維碼即可加群!
點擊文末“閱讀原文”
獲取全文完整代碼數(shù)據(jù)資料。
本文選自《R語言對綜合社會調(diào)查GSS數(shù)據(jù)進行自舉法bootstrap統(tǒng)計推斷、假設檢驗、探索性數(shù)據(jù)分析可視化》。
點擊標題查閱往期內(nèi)容
數(shù)據(jù)分享|PYTHON用決策樹分類預測糖尿病和可視化實例
基于R語言股票市場收益的統(tǒng)計可視化分析
R語言數(shù)據(jù)可視化分析案例:探索BRFSS數(shù)據(jù)
R語言空氣污染數(shù)據(jù)的地理空間可視化和分析:顆粒物2.5(PM2.5)和空氣質量指數(shù)(AQI)
R語言隨機森林RandomForest、邏輯回歸Logisitc預測心臟病數(shù)據(jù)和可視化分析
R語言計算資本資產(chǎn)定價模型(CAPM)中的Beta值和可視化
R語言主成分分析(PCA)葡萄酒可視化:主成分得分散點圖和載荷圖
R語言時變向量自回歸(TV-VAR)模型分析時間序列和可視化
R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態(tài)可視化
R語言用主成分PCA、?邏輯回歸、決策樹、隨機森林分析心臟病數(shù)據(jù)并高維可視化
R語言對布豐投針(蒲豐投針)實驗進行模擬和動態(tài)可視化生成GIF動畫
R語言信用風險回歸模型中交互作用的分析及可視化
R語言生存分析可視化分析
R語言線性回歸和時間序列分析北京房價影響因素可視化案例
R語言用溫度對城市層次聚類、kmean聚類、主成分分析和Voronoi圖可視化
R語言動態(tài)可視化:繪制歷史全球平均溫度的累積動態(tài)折線圖動畫gif視頻圖
R語言動態(tài)圖可視化:如何、創(chuàng)建具有精美動畫的圖
R語言中生存分析模型的時間依賴性ROC曲線可視化
到了這里,關于R語言對綜合社會調(diào)查GSS數(shù)據(jù)進行自舉法bootstrap統(tǒng)計推斷、假設檢驗、探索性數(shù)據(jù)分析可視化|數(shù)據(jù)分享...的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!