国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

湯姆·齊格弗里德《納什均衡與博弈論》筆記(7)博弈論與概率論

這篇具有很好參考價值的文章主要介紹了湯姆·齊格弗里德《納什均衡與博弈論》筆記(7)博弈論與概率論。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

第十一章 帕斯卡的賭注——博弈、概率、信息與無知

在與費馬就這個問題的通信過程中,帕斯卡創(chuàng)造出了概率論。另外,帕斯卡在進行嚴謹?shù)淖诮谭此贾?,得出?strong>概率這個概念,它在此幾百年后,成為一個關(guān)鍵的、對博弈論的提出有重要意義的數(shù)學(xué)概念。

帕斯卡觀察到,當(dāng)下注開賭的時候,僅僅知道輸贏的概率是多少是遠遠不夠的,你還必須知道什么是風(fēng)險。舉個例子,如果贏的概率很小,但如果贏了,回報很高。那么這時,你就可能愿意去冒險。或者你會追求安全,即使回報很低,也把賭注壓在確定會贏的牌上。然而如果知道回報不高,卻將賭注押在一手不那么容易贏的牌上就顯得很不明智了。

帕斯卡在其宗教著作中勾勒出了這個問題的框架,特別是關(guān)于是否存在上帝的賭博情況中。選擇相信上帝就像下了個賭注,他說。如果你相信有上帝,而且這個信念最終被證明是錯誤的,你也不會失去什么。如果上帝的確存在,信仰上帝會使你贏得一生的無尚幸福感。縱使上帝的存在是一個低概率的神的存在,而相信他存在的回報確是那么的巨大(基本上是無限大的)。無論如何,他確實是一個很好的賭注?!白屛覀儊砗饬恳幌略谏系凼欠翊嬖诘牟┺闹械牡檬?,”他寫道,“讓我們來判斷一下這兩種情況。如果你贏了,你會得到所有;如果你輸了,你什么也沒有失去。那么,毫不猶豫,他就是個賭博?!?/p>

帕斯卡的推理也許是在神學(xué)上過分簡單化了,但是確實在數(shù)學(xué)方面很吸引人。關(guān)于一個經(jīng)濟決策進行“數(shù)學(xué)期望”的計算啟示了這種推理方式——你用產(chǎn)出的概率乘以產(chǎn)出本身的價值。理性的選擇一定是那個計算結(jié)果給出最高期望值的決策。帕斯卡的賭博經(jīng)常被引用作最早的基于數(shù)學(xué)方法的決策論的例子。

批注:期望的分布。

在真實生活中,當(dāng)然,人們不會總是簡單地通過這種計算來做決定。并且當(dāng)你的最佳決策依賴于他人是如何決策的時候,簡單的決策論就不管用了——做出最佳決策便成為博弈論的一個問題(一些專家認為,決策論僅僅是博弈論的一個特例,因為在決策論中是一個參與者和自然在博弈)。而且,概率和預(yù)期收益仍然以深遠且復(fù)雜的方式與博弈論有著千絲萬縷的聯(lián)系。由于這個緣故,所有的科學(xué)都和概率論有著深層次的纏結(jié)——整個觀察、實驗和測量過程,以及其后將這些數(shù)據(jù)和理論進行比較都是必需的。而且概率不僅發(fā)生在測量和假設(shè)檢驗中,也會發(fā)生在對物理現(xiàn)象的精確描述中,尤其是在統(tǒng)計物理學(xué)的范疇中。

在社會科學(xué)中,當(dāng)然,概率論也是不可或缺的,就像阿道夫·凱特勒在大約兩百年前說的一樣。因此,我敢打賭,博弈論和概率的密切聯(lián)系是博弈論之所以被廣泛地應(yīng)用在這么多不同科學(xué)領(lǐng)域的原因。并且,毫無疑問,正是博弈論的這個方面使其居于一個如此戰(zhàn)略性的位置,作為一種原動力促使社會學(xué)與統(tǒng)計物理學(xué)融合形成社會物理學(xué)——有些像阿西莫夫的心理史學(xué)或自然法典。

到目前為止,策劃運用社會物理學(xué)來描述社會的嘗試絕大多數(shù)并不以博弈論為基礎(chǔ),而是以統(tǒng)計物理學(xué)為基礎(chǔ)的(如阿西莫夫的小說的心理史學(xué))。但是博弈論中混合策略/概率方程式表現(xiàn)出其與統(tǒng)計物理學(xué)中概率分布的驚人相似。事實上,為達到納什均衡的博弈參與者所使用的混合策略正是概率分布,準確地說,正如統(tǒng)計物理學(xué)里定量表示氣體中分子的分布情況。這個認識推出了一個非凡的結(jié)論——即,從某種意義上說,博弈論和統(tǒng)計物理學(xué)是互相的他我。意即,它們能夠用相同的數(shù)學(xué)語言來表述。更確切地說,你不得不承認博弈論中某些模型與統(tǒng)計物理學(xué)中一些特殊公式在數(shù)學(xué)上是一致的,且其中還存在深層次的內(nèi)在聯(lián)系。只不過,幾乎很少人意識到這一點。

統(tǒng)計學(xué)和博弈

博弈涉及的是參與者;物理學(xué)涉及的是分子。于是沃爾波特就研究能夠體現(xiàn)參與者策略的數(shù)學(xué)方法,就像物理學(xué)中體現(xiàn)分子動態(tài)一樣。所有參與者策略的混合體就像統(tǒng)計物理學(xué)中通常描述的所有原子動態(tài)的集合。他提出的公式,在給定對參與者的有限了解的情況下,可允許你計算出在博弈中任何個體參與者策略的真實集合的接近的近似值。你可以用同樣的方法來計算出所有博弈參與者的混合策略?;旧希譅柌ㄌ卣故玖私y(tǒng)計物理學(xué)中的數(shù)學(xué)方法如何最終與有著有限理性參與者的博弈中所使用的數(shù)學(xué)方法是相同的。“那些論題根本上是同一的,”他在他的文章中寫道,“這個證明增加了將一些統(tǒng)計物理學(xué)中已發(fā)展得很強大的數(shù)學(xué)技術(shù)轉(zhuǎn)移到分析非合作博弈理論中的潛能?!?/p>

沃爾波特的數(shù)學(xué)圖謀植根于“最大熵”理論(maximum entropy,或者叫“maxent”),一個聯(lián)系標準統(tǒng)計物理學(xué)與信息理論的原理,用于量化發(fā)送與收到訊息的數(shù)學(xué)。最大熵的理論是由特立獨行的物理學(xué)家艾德文·杰尼斯(Edwin Jaynes)在他于1957年發(fā)表的文章中創(chuàng)立的,此理論被很多物理學(xué)家所接受,但同時也被其他很多物理學(xué)家所忽視。當(dāng)時,沃爾波特稱杰尼斯的工作“多么光輝而美麗”,并且認為這才是科學(xué)家們必須為了“將博弈論帶入21世紀”所需的東西。

杰尼斯原理吸引人的同時也使人產(chǎn)生挫敗感。它看起來本質(zhì)上簡單,然而卻隱含著錯綜復(fù)雜的關(guān)系。它與物理概念——熵有著緊密的聯(lián)系,但仍有著細微的不同。無論如何,它的解釋需要對概率論與信息理論的本質(zhì)進行簡要的探尋,也就是將博弈論與統(tǒng)計物理學(xué)結(jié)合到一起的本質(zhì)聯(lián)系。

概率和信息

幾個世紀以來,科學(xué)家與數(shù)學(xué)家都在爭論概率的含義。即便今天,仍然存在著不同學(xué)派的概率思想,通常簡單表示為“客觀派”與“主觀派”。但是那些標簽隱藏了次論據(jù)與技術(shù)上的細微的差別,使概率論成為一個數(shù)學(xué)與自然科學(xué)中最充滿爭議和困惑的領(lǐng)域。

多少有點令人吃驚,概率論的確是基于自然科學(xué)的基礎(chǔ),扮演著分析實驗數(shù)據(jù)和理論檢驗過程中的核心角色。這就是科學(xué)所要做的一切。你會認為到如今他們已把問題全部解決。但是,建立科學(xué)的秩序有些類似為伊拉克建立一套憲法。研究科學(xué)的原理和方法紛繁復(fù)雜。事實上,科學(xué)(不像數(shù)學(xué))不是建立在不可約規(guī)則的堅實基礎(chǔ)上的??茖W(xué)就像語法。語法是由使用該語言的本族人在創(chuàng)造詞匯和聯(lián)系詞匯時發(fā)展出來的規(guī)律。一個真正的語法學(xué)家不會告訴人們他們應(yīng)該怎么說,而是整理出人們實際上是如何說的??茖W(xué)并不是烹調(diào)書,提供揭露自然奧秘的菜譜;科學(xué)源于方法的集合,成功詮釋自然。這就是為什么科學(xué)不完全是實驗,也不完全是理論,而是兩者相互影響的復(fù)合體。不過,歸根結(jié)底,理論和實驗必須緊密結(jié)合在一起,如果科學(xué)家對于自然的構(gòu)想是有意義且有用的。那么在大多數(shù)科學(xué)領(lǐng)域里你需要數(shù)學(xué)來驗證它們的結(jié)合。概率論就是實施檢驗的工具(對于如何實施檢驗的不同想法會導(dǎo)致不同的概率概念)。

在麥克斯韋之前,科學(xué)中的概率論主要局限于定量計算諸如測量錯誤等情況。拉普拉斯和其他學(xué)者展示了一種方法來評估在一個確切的置信度下,你的測量值和真實值之間相差多遠。拉普拉斯自己運用此方法測量了土星的質(zhì)量,并推斷出真實的土星質(zhì)量會偏離當(dāng)前的測量值超過1%的情況只有一萬一千分之一(1/11000)的發(fā)生概率(而結(jié)果是,當(dāng)今最好的測量方法與拉普拉斯時代最好的方法精確度只相差0.6%)。概率論已經(jīng)發(fā)展成為一個進行評估的相當(dāng)精確的方法。

然而,概率本身究竟意味著什么?如果你問那些應(yīng)該懂的人,你會得到不同的答案??陀^主義派堅持認為,一個事件發(fā)生的概率是該事件本身的性質(zhì)。你觀察所有情況中事件發(fā)生的片斷,并籍此測量出它的客觀概率。另一方面,主觀派的觀點認為,概率是一種對于某事件可能會怎么發(fā)生的信念。主觀派主張測量某事件多久發(fā)生一次得到一個頻率,而非概率。探究這兩種論點相對優(yōu)劣性的辯論并無意義。一些書籍卻致力于這些爭論,這與博弈論相當(dāng)無關(guān)。事實是,今天流行的觀點,至少是在物理學(xué)家中,是主觀派方法包含了對科學(xué)數(shù)據(jù)進行合理評估的要素。

主觀派統(tǒng)計學(xué)經(jīng)常臣服在貝葉斯的名下。托馬斯·貝葉斯是一名英國牧師,于1763年(在他去世后兩年)發(fā)表的一篇文章中探討了研究自然的方法。今天被人們熟知的貝葉斯定律的公式就是實踐主觀派統(tǒng)計學(xué)方法的核心之所在(盡管精確的定律實際上是拉普拉斯創(chuàng)立的)。無論如何,貝葉斯的觀點在今天都被發(fā)揚光大,而且也有很多關(guān)于它應(yīng)該如何被理解和應(yīng)用的爭論(也許是因為,畢竟它是主觀的)。但是,從實踐的觀點來看,客觀派和主觀派概率論的數(shù)學(xué)方法在任何基礎(chǔ)層面上并沒有實質(zhì)性的區(qū)別,只是在理解上有差異。正如杰尼斯在半個世紀前指出的,只是在一些情況下使用其中一種而非另一種是因為感覺方便,或更合適些。

信息和無知

在他1957年的文章中,杰尼斯在概率的辯論中支持了主觀派的觀點。他認為,這兩種觀點,主觀派和客觀派,物理學(xué)都需要,但是對于一些類型的問題只有主觀派方法能解決。

他爭辯道,即便當(dāng)你對感興趣的體系一無所知、無從下手的時候,主觀派的方法仍然適用。如果給你一個裝滿了微粒的盒子,而你對它們毫不知情——不知道它們的質(zhì)量,不知道它們的組成,也不知道它們的內(nèi)部結(jié)構(gòu)——你對它們的狀態(tài)也不甚了解。你知道很多物理定律,但是你不知道對于這個體系該使用哪個定律。換言之,你對于這些微粒的狀態(tài)的無知已經(jīng)到達了頂點。創(chuàng)立概率論的早期開拓者,如雅格布·伯努利和拉普拉斯,認為,在這種情況下,你必須簡單地假設(shè)所有的可能性出現(xiàn)的概率是相同的——直到你有理由去做不同的假設(shè)。那么,這也許有助于計算,但是假設(shè)所有可能性出現(xiàn)概率相同有確實的(理論)基礎(chǔ)嗎?除了些可以肯定的情況,很明顯兩種可能性發(fā)生概率相同(像硬幣有兩面一樣完美的平衡),杰尼斯說,很多其他的假設(shè)可能被同樣證明是合理的(或者如他慣稱的,任何其他的假設(shè)都是同樣主觀的)。

批注:其實就是為這種想法提供理論基礎(chǔ)吧。

然而,借助了在當(dāng)時來說相當(dāng)新的信息理論,杰尼斯發(fā)現(xiàn)了一種應(yīng)對這種情形的方法,那個理論正是貝爾實驗室的克勞德·夏農(nóng)(Claude Shannon)創(chuàng)立的。夏農(nóng)對如何量化通信很感興趣,特別是發(fā)送信息;通過這種定量方式可以幫助工程師們找到使通信更有效率的辦法(畢竟,他供職于一家電信公司)。他發(fā)現(xiàn)如果你將通信視作對不確定性的降低過程,那么數(shù)學(xué)方法就可以很精確地量化信息。在通信開始前,收到任何信息都是可能的,因此不確定性很高;當(dāng)信息確實被接收后,不確定性就降低了。

夏農(nóng)將這種數(shù)學(xué)方法廣泛應(yīng)用到任何一個信號傳導(dǎo)系統(tǒng)中,從摩斯密碼到煙霧信號。但是假設(shè),例如你所想要做的就是發(fā)送給某人一條單字信息(這個字是從一本標準未刪節(jié)的字典里選出的,大概字典里收錄了50萬字)。如果你告訴接收者這個信息中的單字來自該字典的前半部分,那么你就將這個字出現(xiàn)的可能性從50萬字減少到了25萬字。換言之,你將不確定性減半(這碰巧與一比特信息相符)?;谛畔⒔档筒淮_定性的想法,夏農(nóng)通過它來展示如何量化所有的通信。他發(fā)現(xiàn)了一個精確衡量不確定性的量的公式——不確定性越大,量就越大。夏農(nóng)稱其為熵,一個有意與統(tǒng)計物理學(xué)及熱力學(xué)里使用的物理專業(yè)術(shù)語熵類似的概念。

物理學(xué)家使用的熵是用來度量物理體系混亂度。假設(shè)你有一個房間,里面包括分隔開的兩個隔間,而且你在左邊的隔間里放了100億個氧分子,而在右邊隔間里放了400億的氮分子。然后你移除隔間之間的分隔物。這些分子就會全部迅速混合到一起——更加無序——所以這個體系的熵就增加了。但是其他一些事也會隨之發(fā)生——你不再知道這些分子在哪了。你對它們位置的無知隨著熵的增大而增加。夏農(nóng)展示出他計算通信中熵的公式——作為對無知或不確定性的量度——和統(tǒng)計物理學(xué)中描述微粒集合體中增加熵的公式完全如出一轍。熵,換言之,與無知幾乎等同。熵也是不確定性的同義詞。信息理論提供了一種在概率分布中計算不確定性的新的精確的方法。

因此,當(dāng)你對于你要研究的體系中的概率一無所知的時候,這里有一條線索指引你該如何去做。選擇一個使熵值最大的概率分布!最大熵意味著最大的無知,而且如果你什么都不知道,無知就被限定為最大。假設(shè)出最大熵/無知不僅僅是假設(shè);它是對你所處情況的真實陳述。杰尼斯提出,這個最大無知的概念應(yīng)該被提升到作為科學(xué)地描述任何事物的基本準則的層面。以他的觀點,統(tǒng)計物理學(xué)本身便成為對于一個體系進行統(tǒng)計推論的系統(tǒng)。通過使用最大熵的方法,你仍可以使用所有統(tǒng)計物理學(xué)提供的計算規(guī)則,而無需在基本物理學(xué)方面假設(shè)任何前提。特別地,你現(xiàn)在能夠證明這個觀念,即所有的可能性出現(xiàn)的概率都是等同的。整體思想為,沒有任何一種概率(只要是遵守物理定律的)會被排除。你所獲得的信息中沒有被明確排除的任何情況都將被視為存在發(fā)生的可能(在標準的統(tǒng)計物理學(xué)中,這種特征是無需證據(jù)而簡單地被假設(shè)出的——整體的概率分布基于所有的分子均遵循各自的可能運動狀態(tài)的概念)。而且,如果你一無所知,你不能說任何一個概率相較于另一個概率更可能出現(xiàn)——這是常識。當(dāng)然,如果你了解一些關(guān)于概率的知識,你可以將其融入你使用的概率分布去預(yù)測將來的未知。但是如果你對此一無所知,那供你用來預(yù)測將來的未知的就只剩一種概率分布了:這就是最大熵、最大不確定性、最大無知。畢竟,這種做法還是有意義的,因為一無所知,事實上,即最大無知。

聽起來有些神奇,即使對面前的物體或人一無所知,你仍然可能做出預(yù)測。當(dāng)然,你的預(yù)測可能不一定正確。但是,那仍然是當(dāng)你不知從何做起時,你所能做的最好預(yù)測,你所能找尋的最近似的答案?!案怕史植紝⑹苤朴谀承┫拗频撵刈畲蠡@成為解釋分布推理使用的關(guān)鍵,”杰尼斯寫道,“無論結(jié)果是否符合實驗,它們?nèi)匀淮砘诳捎眯畔⑺茏龅淖罴杨A(yù)估?!?/p>

但是“熵的最大化”確切的含義是什么呢?簡單的解釋是,選擇那些源于一切符合自然法則的可能性集合中的概率分布(既然你一無所知,你也就不能丟下任何可能的情況)。這里有一個簡單的例子。

假設(shè)你想預(yù)測一個有100名學(xué)生的班級所有人的平均成績。你所知道的只有一般規(guī)則(即,自然法則)——每人都會得到一個成績,且成績被定為A、B、C、D或F(不允許任何未評)。你對學(xué)生的水平和努力程度一無所知。那么你對班里孩子們平均成績的最好預(yù)測是什么呢?換言之,你如何找到一個成績的概率分布來告訴你哪個平均成績最有可能是真實的?運用最大熵或最大無知原理,你簡單假設(shè)成績能分布的所有可能情況——所有可能組合出現(xiàn)的概率均等。例如,一種可能的分布是100個A而沒有別的情況出現(xiàn)。另一種可能是全部的F。也可能是每種成績都分別由20人獲得。也可能是50個C、20個B、20個D、5個A和5個F。所有的組合情況全部加和到一起成為一個概率的集合,該集合由符合最大無知原理——對于班級以及學(xué)生和學(xué)生成績的完全無知的所有概率分布組成。

在統(tǒng)計物理學(xué)里,這種情況被稱之為“典范系綜”——系統(tǒng)中分子的所有可能狀態(tài)的集合。每一種組合都是一個微觀狀態(tài)。許多不同可能的微觀狀態(tài)(成績的分布)與相同的平均值(宏觀狀態(tài))一致。不要試圖列出所有可能的組合,那會消耗你大量的時間(你所涉及的數(shù)字可能大得接近10的70次方級別)。但是你能計算出,或者甚至可以憑直覺看出,最有可能的平均成績就是C。在所有可能的微觀狀態(tài)組合中,出現(xiàn)平均成績?yōu)镃的概率比任何其他成績的概率都要大很多。例如,只有一種情況下能得到完美的平均成績?yōu)锳——所有的100個學(xué)生都得到A。但是你得到平均成績是C的情況卻有很多——100個C、50個A和50個F,5個級別的成績各有20人得到,等等。

就像扔硬幣,一次扔4枚硬幣,頭像朝上的硬幣數(shù)量相對于上例中的成績(0就是F,4就是A)。在100次試驗中,許多組合的平均值為2,而只有很少的情況平均值為0或4。因此,基于一無所知,你的預(yù)測為平均成績是C。

博弈論與概率分布

過去科學(xué)家們沒有真正將博弈參與者們當(dāng)作統(tǒng)計物理學(xué)中的微粒來考慮,至少沒有從正確的角度去考慮。如果你真的考慮過這一點,你就會意識到?jīng)]有一個物理學(xué)家在計算氣體熱力學(xué)性質(zhì)時考慮單個分子的狀態(tài)。這個觀點是為了計算出整個分子集合體的全面特征。你不可能知道單個分子在干什么,但是你能夠統(tǒng)計計算出結(jié)合在一起的所有分子的宏觀表現(xiàn)。博弈和氣體之間的聯(lián)系應(yīng)該很清楚了。統(tǒng)計物理學(xué)研究氣體,并不知道單個分子的活動,而博弈論學(xué)家同樣不知道單個參與者是如何思考的。但是物理學(xué)家確實知道分子集合體的表現(xiàn)可能是怎樣的——統(tǒng)計學(xué)意義上的——并且能針對氣體的性質(zhì)給出較好的預(yù)測。類似地,博弈論學(xué)家應(yīng)該能對博弈中將會發(fā)生的事件作出統(tǒng)計學(xué)預(yù)測。

正如沃爾波特反復(fù)強調(diào)的,這就是科學(xué)通常的處理方式??茖W(xué)家們對他們研究的體系相關(guān)的信息進行限制,并試著基于他們手上已有的信息做出可能的最優(yōu)預(yù)測。就像一場博弈中的一個參與者僅僅對這個博弈中可能出現(xiàn)的策略組合持有不完整信息,那么科學(xué)家們就研究在擁有不完整信息情況下的博弈,信息包括參與者們都知道些什么以及他們是如何思考的(切記,不同的個人在博弈時使用的思路是不同的)。

所有的科學(xué)都面對這種問題——對于一個體系知道一些情況,然后就根據(jù)這有限的知識,試圖去預(yù)測將會發(fā)生什么,沃爾波特指出。“那么科學(xué)將如何著手來回答這些問題呢?在你所致力研究的每個獨立的科學(xué)領(lǐng)域中,這種嘗試的結(jié)果將是一個概率分布。”

從這一點看,概率論就引進了另一種混合策略。不僅僅是參與者持有混合策略,備選的可行概率分布也會變化??茖W(xué)家描述博弈持有一種“混合策略”,那就是對于博弈結(jié)果的可行預(yù)測?!爱?dāng)你想到這個的時候,覺得顯而易見,”沃爾波特說,“如果給你一場真人參加的博弈,不,你就不會總是得到同一種結(jié)果。你會得到不止一種可能出現(xiàn)的結(jié)果……他們不可能總是以完全一樣的那套混合策略去結(jié)束博弈。對于他們使用的混合策略會出現(xiàn)一個分布現(xiàn)象,就像在其他科學(xué)問題中一樣”。

……文章來源地址http://www.zghlxwxcb.cn/news/detail-823236.html

到了這里,關(guān)于湯姆·齊格弗里德《納什均衡與博弈論》筆記(7)博弈論與概率論的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 算法基礎(chǔ)-數(shù)學(xué)知識-歐拉函數(shù)、快速冪、擴展歐幾里德、中國剩余定理

    算法基礎(chǔ)-數(shù)學(xué)知識-歐拉函數(shù)、快速冪、擴展歐幾里德、中國剩余定理

    互質(zhì)就是兩個數(shù)的最大公因數(shù)只有1,體現(xiàn)到代碼里面就是 a和b互質(zhì),則b mod a = 1 mod a (目前我不是很理解,但是可以這樣理解:a和b的最大公因數(shù)是1,即1作為除數(shù)和b作為除數(shù)時,對于被除數(shù)a來說余數(shù)是一樣的,即1/a的余數(shù)和b/a是一樣的,即 b mod a = 1 mod a ) 歐拉函數(shù)的作用是

    2024年02月09日
    瀏覽(24)
  • 模型評估:可決系數(shù)與納什效率系數(shù)

    模型評估:可決系數(shù)與納什效率系數(shù)

    ??可決系數(shù)(Coefficient of determination,R)是用來度量一個統(tǒng)計模型的擬合優(yōu)度的。其數(shù)學(xué)表達式如下: 式中:y i 是變量觀測值; y  ̄ overline{y} y ? 是變量觀測值的均值; ?? y ^ i hat{y}_i y ^ ? i ? 是統(tǒng)計模型的變量模擬值; ?? R 2 的取值范圍為[0,1]。 ?? 納什效率系

    2024年02月14日
    瀏覽(149)
  • 全網(wǎng)最新項目:會說話的湯姆貓直播搭建教程(附教學(xué)流程)

    全網(wǎng)最新項目:會說話的湯姆貓直播搭建教程(附教學(xué)流程)

    今天為大家分享一個 湯姆貓直播搭建項目 ,這個項目最近可以說在圈內(nèi)爆火,我相信很多朋友以前應(yīng)該都玩過,或者說給自己家小孩子玩過。 -------------------------------------------------------------------- 課程獲取:www.yn521.cn/160852.html ----------------------------------------------------------------

    2024年02月15日
    瀏覽(15)
  • 【博弈論】【第一章】博弈論導(dǎo)論

    【博弈論】【第一章】博弈論導(dǎo)論

    課程概述: 兩個參與人A和B,輪流選擇[3,4,5,6,7,8,9]中的一個整數(shù)(可重復(fù))。當(dāng)累計總和達到100的時候,博弈結(jié)束。此時判所選數(shù)字恰好使累計總和達到或超過100的參與人為輸家。試問最先行動的A能贏得這場博弈嗎?最優(yōu)策略又是什么? 【解】 整個游戲的過程: 如果前面選擇的

    2024年02月03日
    瀏覽(25)
  • 【學(xué)習(xí)筆記】博弈論 ---- 非偏博弈

    【學(xué)習(xí)筆記】博弈論 ---- 非偏博弈

    本篇按照 Qingyu 在省集講的加入我這個萌新的萌新理解而成。 聽了 Qingyu 的博弈論講解,感覺我之前學(xué)過的博弈就是冰山一角。 由于有一些東西沒聽懂,就主要寫寫我聽懂的部分,沒懂得以后再說吧。 所以這篇只是一個入門,關(guān)于博弈的一些習(xí)題可能會咕咕咕。 幾個基本定

    2024年02月07日
    瀏覽(24)
  • 博弈論 | 斐波那契博弈

    博弈論 | 斐波那契博弈

    博弈論是二人或多人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝目標的理論。博弈論是研究互動決策的理論。博弈可以分析自己與對手的利弊關(guān)系,從而確立自己在博弈中的優(yōu)勢,因此有不少博弈理論,可以幫助對弈者分析局勢,從而采取相應(yīng)策略,最終達到

    2024年02月12日
    瀏覽(22)
  • 博弈論-策略式博弈矩陣、擴展式博弈樹 習(xí)題 [HBU]

    博弈論-策略式博弈矩陣、擴展式博弈樹 習(xí)題 [HBU]

    目錄 前言: 題目與求解 11.請將“田忌賽馬”的博弈過程用策略式(博弈矩陣)和擴展式(博弈樹)分別進行表示,并用文字分別詳細表述。 34.兩個朋友在一起劃拳喝酒,每個人有4個純策略:杠子、老虎、雞和蟲子。 輸贏規(guī)則是:杠子降老虎,老虎降雞,雞降蟲子,蟲子降

    2024年02月03日
    瀏覽(21)
  • 【博弈論筆記】第二章 完全信息靜態(tài)博弈

    此部分博弈論筆記參考自經(jīng)濟博弈論(第四版)/謝識予和老師的PPT,是在平時學(xué)習(xí)中以及期末備考中整理的,主要注重對本章節(jié)知識點的梳理以及重點知識的理解,細節(jié)和邏輯部分還不是很完善,可能不太適合初學(xué)者閱讀(看書應(yīng)該會理解的更明白O(∩_∩)O哈哈~)。現(xiàn)更新到

    2024年02月10日
    瀏覽(21)
  • Nim游戲博弈論

    Nim游戲博弈論

    https://www.luogu.com.cn/problem/P2197 甲,乙兩個人玩 nim 取石子游戲。 nim 游戲的規(guī)則是這樣的:地上有 n n n 堆石子(每堆石子數(shù)量小于 1 0 4 10^4 1 0 4 ),每人每次可從任意一堆石子里取出任意多枚石子扔掉,可以取完,不能不取。每次只能從一堆里取。最后沒石子可取的人就輸了

    2024年02月15日
    瀏覽(22)
  • 博弈論入門

    博弈論入門

    古諾雙寡頭模型的條件 市場中有且僅有兩家公司 策略為同質(zhì)商品的量, q i q_i q i ? 邊際成本為c,生產(chǎn)成本就為c*q,在這里我們的邊際成本是常數(shù)。 需求曲線: P = a ? b ? ( q 1 + q 2 ) P=a-b*(q_1+q_2) P = a ? b ? ( q 1 ? + q 2 ? ) 利潤: U 1 ( q 1 , q 2 ) = P ? q 1 ? c ? q 1 , U 2 (

    2024年02月02日
    瀏覽(29)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包