近年來,人工智能領(lǐng)域已經(jīng)取得突破性進展,對經(jīng)濟社會各個領(lǐng)域都產(chǎn)生了重大影響,結(jié)合了統(tǒng)計學、數(shù)據(jù)科學和計算機科學的機器學習是人工智能的主流方向之一,目前也在飛快的融入計量經(jīng)濟學研究。表面上機器學習通常使用大數(shù)據(jù),而計量經(jīng)濟學則通常使用較小樣本,但這種區(qū)別日漸模糊,機器學習在經(jīng)濟學領(lǐng)域、特別是經(jīng)濟學與其它學科的交叉領(lǐng)域表現(xiàn)日益突出。R語言是用于統(tǒng)計建模的主流計算機語言,用于機器學習十分方便,且學習曲線相比于Python更加平滑,因此是進行機器學習的首選之一。
在本次內(nèi)容中,我們將從論文寫作的實際需求出發(fā),首先簡單的介紹經(jīng)濟學的基本理論與研究方法,讓您了解論文的選題方法與寫作框架。隨后重點從數(shù)據(jù)的收集與清洗、綜合建模評價、數(shù)據(jù)的分析與可視化、數(shù)據(jù)的空間效應(yīng)、因果推斷等方面入手,讓您用最快的速度掌握利用R語言進行經(jīng)濟學研究的技術(shù)。同時也會對論文寫作中經(jīng)常用到的輔助軟件進行介紹,盡量降低論文寫作的難度。
理論基礎(chǔ)與軟件介紹
1.1 經(jīng)濟學基礎(chǔ)原理
主要內(nèi)容:
經(jīng)濟學思考范式,資源配置,效率與公平(古典經(jīng)濟學領(lǐng)域)。
格里高利·曼昆,通俗的講述了十大經(jīng)濟學原理
例如,大衛(wèi)·李嘉圖的比較優(yōu)勢的原理。
例如,機會與成本。正U型定價曲線,MC(邊際成本)ACT(平均總成本)
理性人假設(shè),市場調(diào)節(jié)可能是最優(yōu)解。
丹·艾瑞里 《怪誕行為學》 錨定效應(yīng)
1.2 ?概率統(tǒng)計的基本思想
1.2.1 概率統(tǒng)計的常見概念
概率的誕生,奶茶問題。
正態(tài)分布。
?
?
置信區(qū)間
?
P值
1.2.2 ?評價(單指標評價與復合指標評價)
單指標評價:例如GDP
復合指數(shù)評價
指標體系評價
?
1.2.3 ?因果推斷
概念產(chǎn)生:因果推斷(Causal Inference)是根據(jù)某一結(jié)果發(fā)生的條件對因果關(guān)系作出刻畫的過程,推斷因果關(guān)系的最有效方法是進行隨機對照試驗,但這種方式耗時且昂貴、也無法解釋和刻畫個體差異;因此考慮從觀察數(shù)據(jù)中進行因果推斷,這類框架包括潛在結(jié)果框架和結(jié)構(gòu)因果模型,下文對結(jié)構(gòu)因果模型的因果推理方法進行綜述。
?
?
證據(jù)等級,單個案例,多個案例,隨機對照實驗,循證,機理機制分析
1.3 ?機器學習用于評價和因果推斷(算法介紹)
1.3.1KNN和Kmeans
KNN(K- Nearest Neighbor)法即K最鄰近法,最初由 Cover和Hart于1968年提出,是一個理論上比較成熟的方法,也是最簡單的機器學習算法之一。該方法的思路非常簡單直觀:如果一個樣本在特征空間中的K個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。該方法在定類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
Kmeans
?
?
1.3.2德爾菲和AHP
德爾菲是Delphi的中文譯名。美國蘭德公司在20世紀50年代與道格拉斯公司合作研究出有效、可靠地收集專家意見的方法,以“Delphi”命名,之后,該方法廣泛地應(yīng)用于商業(yè)、軍事、教育、衛(wèi)生保健等領(lǐng)域。德爾菲法在醫(yī)學中的應(yīng)用,最早開始于對護理工作的研究,并且在使用過程中顯示了它的優(yōu)越性和適用性,受到了越來越多研究者的青睞。
AHP(Analytic Hierarchy Process)層次分析法是美國運籌學家T. L. Saaty教授于二十世紀70年代提出的一種實用的多方案或多目標的決策方法,是一種定性與定量相結(jié)合的決策分析方法。常被運用于多目標、多準則、多要素、多層次的非結(jié)構(gòu)化的復雜決策問題,特別是戰(zhàn)略決策問題,具有十分廣泛的實用性。
?
1.3.3熵權(quán)法
TOPSIS-熵權(quán)法
熵權(quán)法是一種基于數(shù)據(jù)信息熵大小計算各個指標權(quán)重的方法,能很好的對多指標目標進行綜合評價。TOPSIS法能進一步優(yōu)化熵權(quán)法的結(jié)果,使評價結(jié)果更加客觀合理[23~25]。
?
?
1.3.4隨機森林算法
機器學習中有一種大類叫集成學習(Ensemble Learning),集成學習的基本思想就是將多個分類器組合,從而實現(xiàn)一個預測效果更好的集成分類器。集成算法可以說從一方面驗證了中國的一句老話:三個臭皮匠,賽過諸葛亮。
?
1.3.5神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)學習分為兩個階段:一是多層前饋階段,從輸入層一次計算各層節(jié)點的實際輸入、輸出;二是反向修正階段,即根據(jù)輸出誤差,沿路反向修正各連接權(quán)重,降低誤差[27]。
?
1.4 常用軟件介紹
Excel,R,Stata,Photoshop,Arcgis,SPSS,Geoda,Python,Notexpress,Endnote
?專題二? ?數(shù)據(jù)的獲取與整理
2.1數(shù)據(jù)類型的介紹
定量數(shù)據(jù),定類數(shù)據(jù),
截面數(shù)據(jù),時間序列數(shù)據(jù),面板數(shù)據(jù)
2.2數(shù)據(jù)的獲取
論文,統(tǒng)計局,年鑒,相關(guān)網(wǎng)站,購買
https://www.ceads.net.cn/
統(tǒng)計年鑒
論文標注
2.3數(shù)據(jù)的整理
常見的格式轉(zhuǎn)換,缺失值的填補
常用評價方法與相關(guān)軟件詳細教學(案例詳解)
3.1農(nóng)業(yè)碳排放計算
3.2能源消費碳排放計算
3.3綜合評價方法
公式的輸入以及熵權(quán)法的實際操作
https://gongshi.wang/
3.4數(shù)據(jù)分析與數(shù)據(jù)可視化
常用數(shù)據(jù)可視化方法介紹
箱線圖,柱狀圖,折線圖,地理圖形等
地理學三大定律與空間自相關(guān)分析
3.5隨機森林回歸建模
3.5.1模型構(gòu)建與相關(guān)參數(shù)的優(yōu)化
3.5.2模型的效果評估
3.5.3模型的結(jié)果分析
3.5.4驅(qū)動因素與機制機理分析(歸因分析,驅(qū)動機制)
3.6神經(jīng)網(wǎng)絡(luò)回歸建模
內(nèi)容同上。
與其它模型效果對比
寫作要點與案例的講解
4.1整體寫作要點
4.1.1好的開始是成功的一半(引言)
文章的選題來源
4.1.2文獻綜述的寫法
4.1.3研究方法的選擇與公式的編輯
4.1.4數(shù)據(jù)分析與可視化(分析)
4.1.5兩種討論方式的寫法(討論)
4.1.6結(jié)論與摘要的寫法
4.1.7心態(tài)建設(shè)以及期刊選擇與投稿
4.2案例講解
4.2.1兩種常見類型論文的介紹
實驗類型的文章介紹
模型計算類文章介紹
4.2.2案例
2000—2020年山西省農(nóng)業(yè)碳排放時空特征及趨勢預測
基于機器學習算法的新疆農(nóng)業(yè)碳排放評估及驅(qū)動因素分析
西北地區(qū)碳排放的驅(qū)動因素與脫鉤效應(yīng)研究
中國農(nóng)業(yè)高質(zhì)量發(fā)展的地區(qū)差異及分布動態(tài)演進
?●如何利用python機器學習解決空間模擬與時間預測問題及經(jīng)典案例分析
●Python數(shù)據(jù)挖掘與機器學習實踐技術(shù)應(yīng)用
●基于python多光譜遙感數(shù)據(jù)處理、圖像分類、定量評估及機器學習方法
●基于現(xiàn)代R語言【Tidyverse、Tidymodel】的機器學習
●R語言Meta全流程、不確定、回歸、診斷分析與繪圖及Meta機器學習文章來源:http://www.zghlxwxcb.cn/news/detail-666678.html
?文章來源地址http://www.zghlxwxcb.cn/news/detail-666678.html
到了這里,關(guān)于R語言機器學習方法在生態(tài)經(jīng)濟學領(lǐng)域的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!