青青草国产成人av片免费/香港三级日本韩国三级专线/国内自拍在钱/天堂国产女人av

回復

囚徒困境

樓主: 32161 | 查看: 3333 | 回復: 8

查看: 3333|回復: 8

[知識科普] 囚徒困境

簡潔模式
發表于 2013-12-10 21:21:17
本帖最后由 キャンディ 于 2013-12-10 21:25 編輯

囚徒困境(prisoner's dilemma ):兩個被捕的囚徒之間的一種特殊博弈,說明為什么甚至在合作對雙方都有利時,保持合作也是困難的。
囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇并非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。

來源
囚徒困境的故事講的是,兩個嫌疑犯作案后被警察抓住,分別關在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。于是,每個囚徒都面臨兩種選擇:坦白或抵賴。然而,不管同伙選擇什么,每個囚徒的最優選擇是坦白:如果同伙抵賴、自己坦白的話放出去,不坦白的話判一年,坦白比不坦白好;如果同伙坦白、自己坦白的話判八年,不坦白的話判十年,坦白還是比不坦白好。結果,兩個嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴,各判一年,顯然這個結果好。但這個帕累托改進辦不到,因為它不能滿足人類的理性要求。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性——聰明的人類會因自己的聰明而作繭自縛。




簡介

單次多重

單次發生的囚徒困境,和多次重復的囚徒困境結果不會一樣。
在重復的囚徒困境中,博弈被反復地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的、合作的結果。作為反復接近無限的數量,納什均衡趨向于帕累托最優。


主旨

囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同伙可為自己帶來利益(縮短刑期),也因為同伙把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同伙會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。







類別

固定困境

試想像囚徒困境的情況進行十次或以下。
我們可以合理地設想,如果囚徒第一次被對方指控,第二次這個囚徒也會指控對方。相反,如果第一次


相關書籍
別人保持沉默,建立了互信的關系,你也會保持沉默,導致帕累托最優。
當然,兩個囚徒都會有相似的想法,在第一局保持沉默,以期望建立互信關系,所以雙方都會保持沉默。第二局時,雙方亦應有相似的想法,繼續保持沉默,以期繼續在互信的情況下進行第三局,以致余下的八局。
這種想法合理嗎?
在第十局時,互信的關系明顯是沒有意義的,因為十局已經完結,囚徒沒有必要為維持互信的關系而沉默(沒有第十一局),所以第十局囚徒一定會背叛對方的,理由和只有一局囚徒困境一樣。
問題是,既然大家都知道在第十局,無論如何對方都會背叛自己的,你在第九局保持沉默也是沒有意思的,要知道,保持沉默(友好關系)的原因是為了希望下一局別人保持沉默。所以第九局雙方都一定會背叛對方的。
下一個問題是,雙方都有相同的想法,明知第九局對方會背叛自己,所以第八局保持沉默也是沒有意思的,第七局亦然,如此類推,納什均衡是十局都會互相背叛,建立互信關系是沒有可能的。
只有在囚徒困境的局數大家都不肯定的情況下,上述的推論才不會發生,才會出現互相保持沉默的現象。
經典困境



例子
1950年,由就職于蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,后來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,并命名為“囚徒困境”。經典的囚徒困境如下:
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:
若一人認罪并作證檢控對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。
若二人都保持沉默(相關術語稱互相“合作”),則二人同樣判監1年。

若二人都互相檢舉(相關術語稱互相“背叛”),則二人同樣判監8年。
用表格概述如下:

甲沉默
甲背叛
乙沉默
二人同服刑1年
乙服刑10年,甲即時獲釋
乙背叛
甲服刑10年,乙即時獲釋
二人同服刑8年


解說
如同博弈論的其他例證,囚徒困境假定每個參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為“嚴格劣勢”,理性的參與者絕不會選擇。另外,沒有任何其他力量干預個人決策,參與者可完全按照自己意愿選擇策略。
囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由于隔絕監禁,并不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:
若對方沉默時,背叛會讓我獲釋,所以會選擇背叛。
若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。
二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑8年。
這場博弈的納什均衡,顯然不是顧及團體利益的帕累托最優解決方案。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑1年,總體利益更高,結果也比兩人背叛對方、判刑8年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛,結果二人判決均比合作為高,總體利益較合作為低。這就是“困境”所在。例子漂亮地證明了:非零和博弈中,帕累托最優和納什均衡是相沖突的。


余下
http://baike.baidu.com/link?url=93wlC76I1Imdzohn8BqQtA5gpWAttGUkso7iagMfOHp_t0u64YXSUVkgr6f6EIDJ

0

6

分享

| 發表于 2013-12-11 15:43:24
本帖最后由 無遙之遠 于 2013-12-11 15:44 編輯

沒聽過,挺新鮮的

小際,我說過,吃我的早晚要還回來的!
| 發表于 2013-12-11 20:21:06
此乃博弈論基礎,經濟學必學
| 樓主| 發表于 2013-12-11 20:49:24
在小說繪里聽過就查了一下
| 發表于 2013-12-15 09:59:02
這個在每天學點博弈學里面看到過
| 發表于 2013-12-15 17:54:35
這個我以前曾看到過。
| 發表于 2014-7-25 12:06:06
看來歹徒也要有好兄弟才行……
| 發表于 2014-8-30 15:59:57
類似的還看到過很多,比如抓綠豆,分財產等等
好像是一本講邏輯推理的書上面的
尚未登錄
您需要登錄后才可以回帖 登錄 | 加入學院