青青草国产成人av片免费/香港三级日本韩国三级专线/国内自拍在钱/天堂国产女人av

回復

囚徒困境與納什均衡。

樓主: 29713 | 查看: 2263 | 回復: 8

發表于 2013-6-23 16:09:14
這個定義是在經濟學原理里會學到的東西??墒菍Ψ治龇缸镆灿悬c用。吧。我自己寫不出來那么專業的講解來,所以,我把老師的課件打出來看一下吧。我覺得用于推理挺有用的。

1950年,斯坦福大學客座教授、數學家為形象的說明博弈過程,構造了著名的囚徒困境模型。


兩個嫌犯甲和乙作案后被警察抓住,隔離審訊。規則是,

如果兩個人都坦白,那么各判八年。

如果一個人坦白一個人不坦白,那坦白的那個放出去,不坦白的那個要判15年。 (好草率的警察)

如果都不坦白,則各判一年。

如果你是那個嫌犯,你會選擇合作還是背叛?

怎么做表格啊。。。。沒有啊。還有那個所見即所得是什么玩意。算了。不用數據了。直接文字分析吧。反正也沒人看。沒人看。

從表面上看,兩個人應該相互合作,保持沉默。但他們不得不考慮對方會怎么做。囚徒困境的模型的前提就是參與者都是利己的,都會要求自身利益最大化。囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同伙可為自己帶來利益(縮短刑期),也因為同伙把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同伙會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。
好像是跑題了 。所以甲會這樣子推理,加入乙不招,我找了,可以立即獲得自由,而不招則會被判一年,那么顯然招比不招好。但是假如乙招了而我沒招,要做15年,而現在我招了,只判10年。顯然,無論乙招與不招,我都招了。而且。乙也會這么想、

所以,個體的理性會導致雙方得到的比可能得到的少,這就是困境所在。

啟示1   在囚徒困境中的最佳策略直接取決于對方的策略,特別是取決于這個策略為發展雙方合作留出多大的余地。獨立于對方策略之外的最佳策略是不存在的。

啟示2   從個人角度上來說,背叛是最好的選擇,但雙方的背叛可能會導致不甚理想的結果出現。

兩個人都選擇背叛,對個人來說是最佳的。照博弈論的說法,這是本問題的唯一平衡點,只有在這一點上,任何一方單方面改變選擇,他只能得到較差的結果。這一點就是納什平衡。

而走出這個困境的三個途徑:
1.  使得未來相對于現在更重要些。
2. 改變對策者的四個可能結果的收益值、(決定合作與否取決于一次博弈還是多次博弈。)
3. 交給對策者那些促進合作的準則、事實和技能。

如何利用囚徒困境。。

如果沒有外部強制力,這時囚徒困境中的兩個參與者采取什么策略才能更好的維持合作的穩定性呢。如果一方采取不合作的策略并且永遠采取不合作策略,這個在博弈論中稱之為觸發策略。如果對方知道你選擇的是觸發原則,那么對方不敢采取不合做策略,雙方便陷入了永遠不合作的境地。因此,一旦有人采取觸發策略,那么雙方都愿意選擇合作策略、

然后觸發策略。。。。突然感覺我寫的和推理沒多大關系哈。。編輯你會讓我過嗎。。打字很辛苦的好嗎。

0

7

分享

| 發表于 2013-6-23 16:57:54
nash和推理能扯上關系么....
| 發表于 2013-6-23 19:26:32
感覺不是百科,倒像邏輯
| 發表于 2013-6-23 19:32:28
其實還是挺有用的,我們刑法老師曾說過這么一句話“坦白從寬,牢底坐穿;抗拒從嚴,回家過年!”
| 發表于 2013-6-23 21:38:33
鄙人目前正研究博弈論
| 發表于 2013-6-24 13:50:20
收藏了,謝謝了
| 發表于 2013-6-24 21:38:52
目測符合詐欺游戲,可以做成游戲{:8_826:}
尚未登錄
您需要登錄后才可以回帖 登錄 | 加入學院