周庭旺

Menu

无处不在的囚徒困境

「囚徒困境」这个问题。这个案例有点深奥,但我们在很多情况下都会遇到,它不仅影响着我们的个人决策,甚至会对人类作为一个物种的存续具有着重要意义,我在后面会详细地讲解这部分内容。

现在,我又要借助你的想象力了,来构建一个场景:警察抓捕了两名犯罪嫌疑人,并将他们带进两间独立的审讯室。一名侦探走进房间,给每个犯罪嫌疑人提供了一个选择。这个选择会影响他们两个人,但是禁止他们俩相互交流。
具体的案情是这样发展的:这两位嫌疑人被逮捕的时候,正在驾驶一辆偷来的汽车。检察官计划以盗窃汽车罪判处他们两年监禁,而且检察官已经掌握了支持这一判决的充足证据。但是,警察还认为,当晚早些时候,这两位嫌疑人还参与了一起驾车枪击案,但目前还没有足够的证据。

因此,警察需要罪犯供认,或者由一个嫌疑人提供证词,以便对另外一名罪犯提出利用致命武器实施严重犯罪的指控。于是,警察走进审讯室,对一名嫌疑人提出了一个交换条件,警察说:「如果你指控另一名嫌疑人,我可以只按盗窃汽车罪判你一年监禁,对枪击事件不予追究。你的同伴会代你接受惩罚,二罪并罚,判处八年监禁。你要为自己着想,机会就在眼前,坦白从宽吧!」

当然,警察也向另外一名嫌疑人开出了同样的条件。因此,如果你是嫌疑人之一,你怀疑你的同伴会先招供,那么你将面临八年监禁。但实际情况是,如果两个嫌疑人马上招供,那检察官就没有必要再利用其中一人,也无需他提供的证词了,检察官并不想进行两次审判。如果两个嫌疑人都招认,那么每人将接受四年监禁;如果两人都拒绝招认,那警察只能用盗窃汽车的证据起诉,每个人只会被判两年监禁。
问题来了:两名犯罪嫌疑人应该做出怎样的理性决策呢?

如果他们像经济学家那样思考,他们会发现自己深深陷入了所谓博弈理论的泥潭。博弈理论学家试图以参与者制定独立战略决策为基础来考虑问题,他们将决策的影响纳入所谓的「支付矩阵」内。经过思考对手可能采取的步骤,以及预测对自己的影响后,每位选手都应该确定一个最优策略。

我们画一张思维分析图,利用「支付矩阵」来研究一下这个问题。

图1

首先,来看图1:有一张桌子,上面画出四个小格子。我们将对手的可能选择放在上面,标注上「如果同伴供认」和「同伴不供认」;然后,在左边,放上「我」的选择,标注上「如果我供认」和「我不供认」;然后,在每个格子里面,我们将得到「我」所能获得的结果。

图2
图3

图3显示的是如果他供认,而我不供认,那么我的刑期将是8年。所以说,如果他供认,我也供认,那么就会像图2显示的那样,可以最大限度地缩短我的刑期。

图4
图5

反过来,看图4,如果对方坚持不招供,而我招供,那我只会被判1年;再看图5,如果他不招供,我也不招供,那么我将服刑2年。所以说,如果他拒绝认罪,那么我招供就可以最大程度地缩短刑期。

你能得到什么结论吗?如果他招供,我也应该招供。如果他不招供,我的最佳对策还是招供。所以,无论他采用什么策略,对我自己最有利的理性选择都是主动招供。

当然了,我的同伴也面临同样的「支付矩阵」,他也会进行相同的考虑。然后我们看到的结果是:我们两人都招供了,都要服刑四年——这是我们俩的理性决策;但是,如果我们都拒绝配合,那么我们俩都要服刑两年。

那就是说,我们两个人理性选择之后的结果,对我们俩都不是最佳结果。为什么呢?主要是因为我们无法沟通,我们不敢相信对方,也就无法达成一个可行的协议。

你能看出,在这种情况下,谁采用了经济学家的思维方式吗?答案是:警察。
警察对激励方式进行了特殊的设计,保证犯罪嫌疑人做出的理性决策会对警察有利。他们设置了一个理性陷阱。其实,这两个犯罪嫌疑人都不具备考虑自己决策强加给另外一方成本的充分激励,他不需要为自己造成的伤害提供补偿,也不会因为积极表现而得到报酬,他不必在整个过程中征得伙伴的同意,他们无法商量、沟通或者达成一项可行的协议。警察为两个犯罪嫌疑人提供了激励,促使他们两个同时做出损害他们总体利益的理性决策。

其实,我们可能在很多情况下,都会遭遇囚徒困境。当我们独立和分别做决策的时候,没有可以执行的协议,不能要求补偿,那么理性选择就会导致对大家都不利的结果。

— 于 共写了1679个字
— 文内使用到的标签:

评论已关闭。