1楼:紫苏苏苏
你好,楼主。楼主问题感觉好深奥和专业
这得找专业人士来解答了 在这个问网友
估计没什么朋友能给予你答案了~·
关于博弈论中囚徒困境的问题
2楼:匿名用户
前提是双方分别审问,不知道对方的策略,只能从自身的角度考虑。
3楼:找着
两个嫌疑犯是被隔离开同时审讯的,即是在双方都不知道对方选择的情况下所作出的选择。想一想,如果是你,你会选择招还是不招?绝大多数人都会选择招任。
博弈论里的囚徒困境怎么解决
4楼:小俊七七
当两个参与者player同时有对对方的最佳反馈时(即达到纳什均衡,也就是同时认罪),就可以得到囚徒困境的最佳结果。
其实两个囚犯如果都否认犯罪,那么便能获得最少的判刑。但是两个囚犯都在关在不同的地方,双方也无法碰面,所以无法确信对方是否会背叛自己。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低,所以二人的理性思考都会得出相同的结论——选择背叛。
因此,这场博弈中只有一种可能能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
扩展资料
囚徒困境经典例子
1950年,由就职于兰德公司的梅里尔·弗勒德(merrillflood)和梅尔文·德雷希尔(melvindresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(alberttucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
**逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是**分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。
若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。
5楼:匿名用户
20190903 数学05
6楼:一零哑剧
1、利用无限次重复博弈(例如,经典的针锋相对策略、冷酷策略等)2、利用信息不完全(例如,声誉效用、个体类型等)3、利用心智模型,放松主体假定(例如带有同情的博弈)4、本方可以采取一些措施(如降低本方的收益,签协议)让对方有理由相信你没有动机产生偏离,从而有动机产生合作
历史上曾经有人在真实环境中做过囚徒困境的实验,发现重复博弈后的结果就是趋于合作。
其实经典博弈论中的“个体绝对理性”假设实在是太强了,因此后来有人就提出了“有限理性”的假设,即人们的计算能力是有限的,不可能用数学去计算分析完博弈的所有结果后再做出选择(因为很多情况下人们并不知道该怎么分析),而只是依据经验做出选择,然后再对结果进行学习(举例来说,如果你没学过博弈论,你可能就不知道该如何“理性”地分析囚徒困境,你所做的只是依据经验做出选择)。这个思想其实和生物进化论的思想差不多(或者机器学习也类似),其中的一个概念就是evolutionarily stable strategy。因此博弈论在某些方面还不够完善,它还不太适合来进行“**”
7楼:匿名用户
打破前提,就可以破解囚徒困境了!
很简单,不断重复!不断重复!一提到囚徒困境,很多人只知道,两个囚犯都会坦白,因为这样对个人收益最大!
并且这种选择只有一次!两个人进行这次试验后,不会再相遇!就算我出卖你,那我也没什么后顾之忧!
是吧?ok,那我们增加一个条件,进行100次这样的实验,而且在同样的两个人身上!哈哈,经典来了!
随着实验次数的增加,他们就会发现,合作对于他们而言,才是最好的选择!你出卖我,那么我以后就都出卖你!这是一种惩罚机制!
同时,因为他们还要被继续试验下去,实验者会一直选择合作!而不是单方面的坦白!
8楼:千里挥戈闯天涯
囚徒困境:
**逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是**分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
因此,甲乙二人的支付矩阵为:
从支付矩阵中可以看到,甲乙的纳什均衡为同时认罪;但其实甲乙二人同时沉默才能使得判刑时间最短。因此想要跳出囚徒困境,甲乙二人必须充分地信任对方,才能同时保持沉默,使得各自的支付最大。
9楼:
prisoner's
dilemma 囚徒困境是game theory中经典的问题。
当两个参与者player同时有对对方的最佳反馈best response formula时,(即达到纳什均衡nash equillibrium),我们就可以得到囚徒困境的最佳结果out***e.
下文的br指的是best response(最佳方案)
从图中我们可以看出,br1(player2合作)=背叛(5)br1(player2背叛)=背叛(1)
同理 br2(player1合作)=背叛(5)br2(player1背叛)=背叛(1)、
从上面可得,这个例子中唯一的纳什均衡是(背叛,背叛)=(1,1) 在当前游戏是simoutanious game的前提条件下,无论对方用什么方案,我都想背叛,因为我不能保证其他的player在我合作的时候背叛我以获得更高的payoff(收益)。
=,=手打的,自己写的东西。
10楼:上官
最佳确定性策略被认为是"以牙还牙"。
这是阿纳托尔·拉波波特(anatolrapoport)开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的,只包含了四行basic语言,并且赢得了比赛。
“以牙还牙”策略是:
第一次与对方合作,从第二次开始,每一次都用对方前一次对待自己的方式来对待它,
也就是:如果前一次对方背叛自己,那么这一次自己就背叛对方;如果前一次对方与自己合作,那么这次自己就与对方合作。
更好些的策略是"宽恕地以牙还牙"。当你的对手背叛,在下一回合中你无论如何要以小概率(大约是1%~5%)时而合作一下。
这是考虑到偶尔要从循环背叛的受骗中复原。当错误传达被引入博弈时,"宽恕地以牙还牙"是最佳的。这意味着有时你的动作被错误地传达给你的对手:你合作但是你的对手听说你背叛了。
拓展资料:
静态博弈,又叫囚徒困境,它**于一个非常有趣的例子:
有一对兄弟因为涉嫌犯罪被警察抓了起来,两人被关在不同的审讯室,他们有两个选择,坦白或者沉默,如果两人都选择坦白,那么两人都会获刑8年,如果两人都选择沉默,那么两人都会获刑1年,如果一人选择坦白一人选择沉默,坦白者会获得自由,沉默者会获刑20年。请问两人应该采取什么样的策略呢?
11楼:请叫丶我海哥
分情况讨论,首先对甲或者已来说 背叛都是最优策略。所以都会选背叛。然而也并非都是背叛,可以通过一些制约达成合作,从而使双方过得最大利益,例如合法的方式制定合同,或者暴力威胁等。
博弈论中有关囚徒困境的问题!!
12楼:匿名用户
囚徒的困境并没说囚徒只合伙犯罪一次,而且,即使准备合作30次,如果在第一次没有商量好**后的供词,任然会出现囚徒困境
13楼:
这个问题取决于“他们打算出狱后一起再次犯罪的渴望程度”(以下用a)与“开始的犯罪活动中被逮捕后受到惩罚的害怕程度”(以下用b)之间的博弈。如果a大于b,这两个罪犯不管是谁出卖谁,最终都不能达到一起犯罪的目的,那么两个罪犯一定从开始到最后都打死不承认,就能实现共赢。如果b大于a,还是会出现囚徒困境。
14楼:匿名用户
不会,两人并没有出现信息不对称的情况。既然两人已经决定合伙犯罪n次,目前暂假定n=30,其实这个30只是个假设的数,是任何其他数都没影响,也就是说两人在**之前有约定,绝对不会相互背叛,所以无论在审讯时出现任何情况,他们都没有任何顾虑,因此不会相互背叛,即不会出现囚徒困境。
囚徒困境出现的条件是:相互猜忌,互有顾虑,相互信息不对称。
15楼:匿名用户
囚徒困境是在以自我为中心的价值状况下才能出现的,表现强烈的是西文价值观造成的一种理论基础。从中国传统文化中,这种情况出现应另作具体分析。二人能直到一起犯罪必有情感基础,出卖同伴不管是心理还是实际社会上是要付出代价的,这不仅只考虑几年牢狱这苦,大部分在中国社会中不会出现囚徒困境,而只会出现二种人,一是是否要出卖同伴,一是死扛作出自我牺牲,而不会考虑对方会怎么想。
博弈论中囚徒的困境大致内容
16楼:匿名用户
两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:
如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判十年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。
如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
博弈论里的囚徒困境怎么理解?
17楼:匿名用户
“囚徒困境”。一位富翁在家中被杀,财物被盗。**抓到两个犯罪嫌疑人a和b,并从他们身上搜到了被害人家中丢失的财物。
但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是**将两人隔离,检察官分别和每个人单独谈话,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。我可以和你做个交易,如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。
如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑”。此时a和b面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判一年。然而由于两人处于隔离的情况下无法串供,每一个人都只能从对自己最有利的前提出发,选择了坦白。这样,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
这种两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。在“纳什均衡”中,每一方在选择策略时都没有“共谋”,他们只是选择对自己最有利的策略,而不考虑共同合作或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成,但实施这样的策略的结局也是对所有人都不利的结局。
中国检验检疫reach解决中心 “囚徒困境”有着广泛而深刻的意义,在经济、社会、政治、国防、管理和日常生活发挥着无法抗拒的作用,也是企业在面对reach注册中遇到的难题之一。如前所述,联合应对reach是对所有企业最有利的结局,然而却不是每一个企业的最有利的策略,因为每一个企业都要面临其它企业搞小动作导致自己更大损失的风险(具体在另文中分析)。为了避免这种风险,所有企业还是选择了单独应对reach这样一种对所有企业最不利的策略。
关于博弈论中囚徒困境的问题,博弈论中有关囚徒困境的问题!!
1楼 匿名用户 前提是双方分别审问,不知道对方的策略,只能从自身的角度考虑。 2楼 找着 两个嫌疑犯是被隔离开同时审讯的,即是在双方都不知道对方选择的情况下所作出的选择。想一想,如果是你,你会选择招还是不招?绝大多数人都会选择招任。 博弈论中有关囚徒困境的问题!! 3楼 匿名用户 囚徒的困境并没说囚...
博弈论是什么?博弈论研究什么问题?有什么作用
1楼 匿名用户 博弈论又被称为对策论 game theory ,它是现代数学的一个新分支,也是运筹学的一个重要组成内容。在《博弈圣经》中写到 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。 按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的robert auman...
博弈论是什么?博弈论的思想是什么
1楼 锅小贝 game theory啦。楼上的定义都很全,我举个例子补充下。假设a,b两个人被分别审讯对方是否说谎,a和b都说没有,各自无罪释放 a说有b说没有,a5年b1年 a说没有b说有,a1年b5年 ab都说有,各10年。 因此就有4种情况来分析 a有b 10 10 5 1 b有 没1 5 0...