本次案例較為簡單,符合人文社科、經(jīng)濟(jì)學(xué)管理學(xué)等專業(yè)本科生適用。
本文的數(shù)據(jù)來源于中國家庭金融調(diào)查(China Household Finance Survey,CHFS)是西南財(cái)經(jīng)大學(xué)中國家庭金融調(diào)查與研究中心(下稱中心)在全國范圍內(nèi)開展的抽樣調(diào)查項(xiàng)目,由甘犁教授于2009年發(fā)起并領(lǐng)導(dǎo),收集有關(guān)家庭金融微觀層次的相關(guān)信息。
這個數(shù)據(jù)很大很雜,本文選取家庭人口,總消費(fèi),總收入,和負(fù)債四個變量作為解釋變量,資產(chǎn)作為被解釋變量,進(jìn)行回歸分析。
(這五個變量數(shù)據(jù)都是我自己清洗處理出來的,需要這代碼演示數(shù)據(jù)的同學(xué)可以參考:數(shù)據(jù))
案例背景:
家庭是社會部門中重要組成部分,掌握了大量財(cái)富資源,以我國為例,統(tǒng)計(jì)數(shù)據(jù)顯示,我國個人持有的可投資資產(chǎn)總體規(guī)模已達(dá)到190萬億元。家庭資產(chǎn)配置情況,不僅事關(guān)家庭自身財(cái)富保值增值和抵御風(fēng)險(xiǎn),也事關(guān)整個國家的經(jīng)濟(jì)、金融發(fā)展,逐漸成為研究熱門領(lǐng)域。
一方面,家庭資產(chǎn)配置對于家庭財(cái)富累積和抵御風(fēng)險(xiǎn)具有重要意義。家庭資產(chǎn)配置的合理性與否,會影響到家庭收入的穩(wěn)定性,諸如調(diào)查顯示我國城市家庭資產(chǎn)配置較為單一和極端,此外研究也發(fā)現(xiàn)家庭資產(chǎn)配置相距理論研究的構(gòu)成還有很大差距,主要表現(xiàn)為風(fēng)險(xiǎn)金融資產(chǎn)持有不足,這就是“有限參與”之謎。此外,隨著經(jīng)濟(jì)增長增速的放緩,工資等勞動性收入放緩,而投資等財(cái)產(chǎn)性收入占比將上升,實(shí)現(xiàn)有效的資產(chǎn)配置有利于提升家庭財(cái)富累積水平。
另一方面,家庭資產(chǎn)配置對于金融市場發(fā)展具有重要影響。家庭資產(chǎn)是經(jīng)濟(jì)發(fā)展的重要資金來源,諸如家庭資產(chǎn)中形成的儲蓄會形成社會投資的資金來源。實(shí)證研究表明,家庭資產(chǎn)配置的結(jié)構(gòu)與金融發(fā)展水平呈現(xiàn)相互影響的關(guān)系。一方面,家庭資產(chǎn)配置會受限于金融發(fā)展水平,尤其是金融可獲得性、金融市場發(fā)展等,豐富的金融產(chǎn)品有利于推動家庭資產(chǎn)配置的多元化;另一方面,家庭資產(chǎn)配置的結(jié)構(gòu)也會影響到金融發(fā)展水平,如果家庭資產(chǎn)配置過于集中于存款等低風(fēng)險(xiǎn)資金,那么很難支持股市的發(fā)展,以美國為例,通過設(shè)立養(yǎng)老賬戶,積極配置公募基金參與到股市的發(fā)展,實(shí)現(xiàn)了美國股市的長期牛市。
不過,家庭資產(chǎn)配置與之前研究的保險(xiǎn)公司等機(jī)構(gòu)資產(chǎn)配置有較大差別,這主要在于機(jī)構(gòu)資產(chǎn)配置具有很高的專業(yè)性,同時也會有部分監(jiān)管要求的體現(xiàn),從而實(shí)現(xiàn)科學(xué)合理的資產(chǎn)配置,而家庭資產(chǎn)配置很難做到如此理性投資決策,而且研究發(fā)現(xiàn)家庭資產(chǎn)配置具有很強(qiáng)的慣性,也就是資產(chǎn)配置結(jié)構(gòu)具有顯著的延續(xù)性,同時家庭資產(chǎn)配置一個是代際傳承的目標(biāo),諸如部分父母是想要將部分財(cái)產(chǎn)留給子女,這也決定了家庭資產(chǎn)配置的復(fù)雜性和異質(zhì)性。
研究目的與意義
通過本文研究,我們可以達(dá)到以下三點(diǎn)目的:
- 探究影響家庭資產(chǎn)變動的一些基本宏觀微觀的經(jīng)濟(jì)指標(biāo)因素。
- 對比我國家庭資產(chǎn)配置和國外不一樣的現(xiàn)象不同和原因。
- 對我國家庭資產(chǎn)和其可能的影響因素做出線性回歸,分析我國家庭資產(chǎn)的影響因素
二、相關(guān)理論
(都是廢話看看就行....代碼在第三章)?
(一)中外家庭資產(chǎn)配置的影響因素
首先需要了解的是什么因素影響著家庭資產(chǎn)配置,尤其是金融資產(chǎn)配置,其中的機(jī)制如何。明白了家庭資產(chǎn)配置的影響因素,也會為相關(guān)政策制定提供了一定參考。綜合中外研究成果,影響家庭資產(chǎn)配置的因素較多,主要分為外部因素和內(nèi)部因素,尤其是以內(nèi)部因素為主,包括年齡、收入、健康、風(fēng)險(xiǎn)偏好、背景風(fēng)險(xiǎn)、性別、家庭人口數(shù)量、互聯(lián)網(wǎng)、社會信任和互動、社會保障水平、教育、信貸約束、職業(yè)、城鄉(xiāng)、幸福感等,可以確認(rèn)的因素較多,這里主要談一下年齡、性別、風(fēng)險(xiǎn)偏好、互聯(lián)網(wǎng)、城鄉(xiāng)差異、職業(yè)、家庭人口數(shù)量等因素的影響情況。
年齡方面,根據(jù)生命周期理論,不同生命階段的收入和支出狀況決定了在資產(chǎn)配置方面的差異,與傳統(tǒng)的認(rèn)為隨著年齡增長風(fēng)險(xiǎn)金融資產(chǎn)配置比例下降的觀點(diǎn),現(xiàn)有實(shí)證研究認(rèn)為,年齡與風(fēng)險(xiǎn)金融資產(chǎn)配置比例呈現(xiàn)倒U型關(guān)系,也就是風(fēng)險(xiǎn)資產(chǎn)配置比例隨著年齡不斷上升,會在某個年齡達(dá)到定點(diǎn),一般認(rèn)為50-60歲之間是配置風(fēng)險(xiǎn)金融資產(chǎn)的最高峰此后開始下降。不過,也有認(rèn)為年齡與風(fēng)險(xiǎn)金融資產(chǎn)配置占比呈現(xiàn)雙峰關(guān)系,也就是經(jīng)歷兩個高峰階段,而且第二個階段的高度要高于第一個階段。但是不管怎樣,隨著進(jìn)入老齡化社會,為了應(yīng)對養(yǎng)老消費(fèi),需要保持穩(wěn)定的支出來源和流動性,對于風(fēng)險(xiǎn)金融資產(chǎn)的需求是持續(xù)下降的。
性別方面,家庭中掌握財(cái)務(wù)和資產(chǎn)配置的成員性別是會影響到資產(chǎn)配置構(gòu)成的。這主要在于研究發(fā)現(xiàn),女性在風(fēng)險(xiǎn)偏好方面要比男性更為穩(wěn)健和保守。
風(fēng)險(xiǎn)偏好方面,風(fēng)險(xiǎn)偏好更多是一個各類因素作用于家庭資產(chǎn)配置的核心機(jī)制。風(fēng)險(xiǎn)偏好的形成既有先天因素,諸如性別、年齡、健康,也有后天因素,諸如收入、教育水平等。這些因素作用形成了各國家庭風(fēng)險(xiǎn)偏好的差異性,進(jìn)而也會作用于家庭資產(chǎn)配置的結(jié)構(gòu)。從國內(nèi)實(shí)證研究看,家庭風(fēng)險(xiǎn)偏好與資產(chǎn)組合分散度呈現(xiàn)正相關(guān)關(guān)系,這也可以進(jìn)一步解釋我國家庭資產(chǎn)配置具有單一性,更多低風(fēng)險(xiǎn)偏好的家庭將資金投資于銀行理財(cái)?shù)壬贁?shù)資產(chǎn),從而形成了較為集中的資產(chǎn)組合。
互聯(lián)網(wǎng)方面,互聯(lián)網(wǎng)的普及率在持續(xù)上升,提供了大量及時信息,有利于解決金融產(chǎn)品交易中的信息不對稱問題?;ヂ?lián)網(wǎng)的這種信息傳遞屬性也有利于優(yōu)化家庭的資產(chǎn)配置,主要是降低交易成本。不過互聯(lián)網(wǎng)應(yīng)用的影響在一定程度上是存在異質(zhì)性,對于高學(xué)歷、金融投資經(jīng)驗(yàn)豐富的家庭具有更大的益處,而對于其他人群影響不大。
城鄉(xiāng)差異方面,由于我國具有顯著的二元經(jīng)濟(jì)體特征,城鄉(xiāng)發(fā)展差距較大,這也會造成城鄉(xiāng)家庭資產(chǎn)配置的差異性。實(shí)證研究也證實(shí)了這點(diǎn),戶主的戶籍性質(zhì)以及城鄉(xiāng)家庭分布等都會造成彼此之間的資產(chǎn)配置差異,尤其是在風(fēng)險(xiǎn)金融資產(chǎn)方面,這種差異體現(xiàn)的更為顯著。
家庭人口數(shù)量方面,針對這一因素部分論文也有所提及,不過實(shí)證結(jié)果的結(jié)論并不一致,一種解釋是家庭成員較多,未來支付等不確定性增大,從而需要家庭預(yù)留更多安全資產(chǎn),降低風(fēng)險(xiǎn)金融資產(chǎn)的配置;另一種解釋認(rèn)為,家庭成員多,收入來源增加,財(cái)務(wù)水平增大,有利于提升對于風(fēng)險(xiǎn)資產(chǎn)的配置力度。
(二)影響家庭資產(chǎn)的宏觀因素
(1)經(jīng)濟(jì)周期
經(jīng)濟(jì)周期包括四個階段:衰退、危機(jī)、復(fù)蘇和繁榮。一般來說,在經(jīng)濟(jì)衰退期間,家庭資產(chǎn)的配置更傾向于持有貨幣。根據(jù)美林時鐘的理論,在不同的經(jīng)濟(jì)周期,每種資產(chǎn)的性價比是不一樣的,因此每個家庭可能會根據(jù)經(jīng)濟(jì)周期去動態(tài)的調(diào)整自己的資產(chǎn)組成。
(2)通貨膨脹水平
通貨膨脹是影響股市和股價的重要宏觀經(jīng)濟(jì)因素。一般來說,貨幣供應(yīng)量與股票價格成正比,即貨幣供應(yīng)量的增加使股票價格上漲, 在通貨膨脹階段,錢是不值錢的,因此持有商品或金融資產(chǎn)是最明智的選擇。
(3)利率變化
利率水平的變化對儲蓄有非常大的影響,如果利率高的話,我國儲蓄整體的水平就會明顯提高。
(4)自然因素
正常情況下, 家庭資產(chǎn)主要是以增值和滿足個人需求進(jìn)行配置的。但如果發(fā)生了天災(zāi)人禍等不可抗拒的因素后,這些資產(chǎn)配置會有極大的變動。比如新冠疫情期間,更多的人就會選擇買食物等生活物資。
(5)經(jīng)濟(jì)指標(biāo)
根據(jù)政府相關(guān)部門發(fā)布的各種經(jīng)濟(jì)指標(biāo)和景氣政策信號,家庭資產(chǎn)配置者可以分析經(jīng)濟(jì)增長走勢判斷資產(chǎn)的類別。
三、實(shí)證研究
(一)研究設(shè)計(jì)
本文的數(shù)據(jù)來源于中國家庭金融調(diào)查(China Household Finance Survey,CHFS)是西南財(cái)經(jīng)大學(xué)中國家庭金融調(diào)查與研究中心(下稱中心)在全國范圍內(nèi)開展的抽樣調(diào)查項(xiàng)目,由甘犁教授于2009年發(fā)起并領(lǐng)導(dǎo),收集有關(guān)家庭金融微觀層次的相關(guān)信息。
本文選取家庭人口,總消費(fèi),總收入,和負(fù)債四個變量作為解釋變量,資產(chǎn)作為被解釋變量,進(jìn)行回歸分析。變量名稱和其英文簡稱如下表所示:
表1 變量說明
familynum |
consump_total |
income_total |
debt |
asset |
家庭人口 |
總消費(fèi) |
總收入 |
負(fù)債 |
資產(chǎn) |
(二)模型構(gòu)建
本文采用的是多元線性回歸模型,涉及多個自變量的多元線性回歸方程,表示為:
?其中,Y是資產(chǎn)(asset),x1至x4代表為家庭人口(familynum)、總消費(fèi)(consump_total)、總收入(income_total)、負(fù)債(debt)。ε代表是誤差項(xiàng)的隨機(jī)變量,β0代表截距,β1至β10代表每個變量的斜率。
(三)數(shù)據(jù)檢驗(yàn)
描述性統(tǒng)計(jì):
開始代碼,導(dǎo)入包:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams ['font.sans-serif'] ='SimHei' #顯示中文
plt.rcParams ['axes.unicode_minus']=False #顯示負(fù)號
sns.set_style("darkgrid",{"font.sans-serif":['KaiTi', 'Arial']})
數(shù)據(jù)讀取,展示前五行
data=pd.read_excel('data_clean.xlsx')
data.head()
?描述性統(tǒng)計(jì)
data.describe()
總共34609個觀測量。表示不同家庭還有不同時間點(diǎn)上的家庭資產(chǎn)負(fù)債等變量的情況。可以看出,除了人口,其他這幾組變量的方差都很大,說明幾組數(shù)據(jù)波動性較大。分布較為分散。其中人口的平均值為3.27,說明絕大多數(shù)家庭都是三口之家,這和我國目前的國情也符合。進(jìn)一步考察每個變量的箱線圖和密度圖如下:??
先去掉極端值和異常值:
data=data[data['consump_total']<2e6]
data=data[data['income_total']<0.75e7]
data=data[data['income_total']>-0.25e7]
data=data[data['debt']<5e6]
data=data[data['asset']<5e7]
畫箱線圖:
column = data.columns.tolist() # 列表頭
fig = plt.figure(figsize=(7,4), dpi=128) # 指定繪圖對象寬度和高度
for i in range(5):
plt.subplot(2,3, i + 1) # 2行3列子圖
sns.boxplot(data=data[column[i]], orient="v",width=0.5) # 箱式圖
plt.ylabel(column[i], fontsize=12)
plt.tight_layout()
plt.show()
?密度圖:
fig = plt.figure(figsize=(7,4), dpi=128) # 指定繪圖對象寬度和高度
for i in range(5):
plt.subplot(2,3, i + 1) # 2行3列子圖
ax = sns.kdeplot(data=data[column[i]],color='blue',shade= True)
plt.ylabel(column[i], fontsize=12)
plt.tight_layout()
plt.show()
#畫皮爾遜相關(guān)系數(shù)熱力圖?
corr = plt.subplots(figsize = (4,4),dpi=128)
corr= sns.heatmap(data[column].corr(),annot=True,square=True)
?
從相關(guān)系數(shù)表中可以得知,與資產(chǎn)相關(guān)系數(shù)最大的是消費(fèi),為0.4733。其次為收入,再就是負(fù)債和人口數(shù)量。解釋變量之間的相關(guān)系數(shù)都不算高,因此該模型應(yīng)該不會出現(xiàn)多重共線性的問題。下面進(jìn)行回歸分析。
回歸分析?
導(dǎo)入包,寫出回歸方程式
import statsmodels.formula.api as smf
import statsmodels.api as sm
all_columns = "+".join(data.columns[:-1])
print('x is :'+all_columns)
formula = 'asset~' + all_columns
print('The regression equation is :'+formula)
進(jìn)行擬合:
results = smf.ols(formula, data=data).fit()
results.summary()
將四組自變量對因變量資產(chǎn)做多元線性回歸,得到的結(jié)果如下:?
?
?上面的展示結(jié)果類似于Eviews,或者這樣打印出來好看一些:
print(results.summary())
調(diào)整后的R-squared=0.32,說明資產(chǎn)變動的幅度有32%可以用此模型解釋。雖然擬合優(yōu)度不算很高,但是整體回歸模型的F值為4083.75,說明整體回歸方程十分顯著。
對于每一個變量的顯著性檢驗(yàn),從回歸結(jié)果中,我們可以發(fā)現(xiàn)在0.05的顯著性水平下,觀察P值, 四組解釋變量它們的系數(shù),都通過了顯著性檢驗(yàn),說明他們的變動對于資產(chǎn)的變動影響是顯著的。并且t值都很大,說明是十分顯著。其中最為顯著的是消費(fèi),說明消費(fèi)越高的家庭資產(chǎn)也越高。而人口與資產(chǎn)是反方向變動,家庭里面的人口如果越多,那么家庭的資產(chǎn)就越少。
?輸出方差分析表
from statsmodels.stats.anova import anova_lm
anova_lm(results,typ=1)
?下面檢驗(yàn)?zāi)P偷?strong>多重共線性。
定義計(jì)算方差膨脹因子的函數(shù)VIF:
#容忍度和方差擴(kuò)大因子
def vif(df_exog,exog_name):
exog_use = list(df_exog.columns)
exog_use.remove(exog_name)
model=smf.ols(f"{exog_name}~{'+'.join(list(exog_use))}",data=df_exog).fit()
rsq=model.rsquared
return 1./(1.-rsq)
計(jì)算上述的回歸得到的方差膨脹因子如下:
df_vif=pd.DataFrame()
for x in data.columns[:-1]:
vif_i=vif(data.iloc[:,:-1],x) #X們都放入
df_vif.loc['VIF',x]=vif_i
df_vif.loc['tolerance']=1/df_vif.loc['VIF']
df_vif
一般認(rèn)為方差膨脹因子大于10的變量就具有多重共線性,本文的四個變量的VIF值都是一點(diǎn)多,遠(yuǎn)小于10,說明模型不存在嚴(yán)重的多重共線性。
殘差分析
畫出殘差圖和殘差的QQ圖:?
x=results.fittedvalues ; y=results.resid
plt.subplots(1,2,figsize=(7,3),dpi=128)
plt.subplot(121)
plt.scatter(x,y)
plt.xlabel('擬合值')
plt.ylabel('殘差')
plt.title('(a)殘差值與擬合值圖',fontsize=12)
plt.axhline(0,ls='--')
ax2=plt.subplot(122)
pplot=sm.ProbPlot(y,fit=True)
pplot.qqplot(line='r',ax=ax2,xlabel='期望正態(tài)值',ylabel='標(biāo)準(zhǔn)化的觀測值')
ax2.set_title('(b)殘差正態(tài)Q-Q圖',fontsize=12)
plt.tight_layout()
plt.show()
可以看到殘差不是很符合正態(tài)性的假定,所以模型里面考慮的因素不完全,在殘差里面體現(xiàn)出來了。這也是為什么擬合優(yōu)度只有32%。因此這個模型需要考慮更多的變量進(jìn)去才行。
四、研究結(jié)論及啟示
(一)主要結(jié)論
本文首先通過分析我國家庭資產(chǎn)配置的特點(diǎn)以及和國外的不同,還有影響因素的可能性的分析。再利用2019年的家庭金融調(diào)查數(shù)據(jù),選取了收入消費(fèi)資產(chǎn)負(fù)債人口等因素做出回歸分析,分析我國家庭資產(chǎn)變動影響因素。
實(shí)證結(jié)果顯示,對于我國家庭資產(chǎn)來說,人口,消費(fèi),收入和負(fù)債都是影響家庭資產(chǎn)很重要的原因。他們對于資產(chǎn)都是有顯著性的影響。其中影響因素最大的是消費(fèi),說明消費(fèi)越多的家庭,他們的資產(chǎn)也越多。消費(fèi)收入和負(fù)債,對于資產(chǎn)的影響都是正向變動的,而人口對于資產(chǎn)的影響是負(fù)向變動,說明一個家庭里面人口越多,資產(chǎn)越少。
結(jié)束語
本文的不足之處在于實(shí)證分析研究中模型較為簡化,資產(chǎn)變動的影響控制變量有的不是很顯著,考慮變量沒有特別全面,因此擬合優(yōu)度也不算很高。所以本文所得結(jié)論也具有一定程度的局限性。僅對該課題進(jìn)行了淺層次的研究。文章來源:http://www.zghlxwxcb.cn/news/detail-491170.html
創(chuàng)作不易,看官覺得寫得還不錯的話點(diǎn)個關(guān)注和贊吧,本人會持續(xù)更新python數(shù)據(jù)分析領(lǐng)域的代碼文章~(需要定制代碼可私信)文章來源地址http://www.zghlxwxcb.cn/news/detail-491170.html
到了這里,關(guān)于Python數(shù)據(jù)分析案例20——我國家庭資產(chǎn)影響因素分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!