囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择,也不相信对方不会背叛自己。
那么在困境中任何一名理性囚徒都会做出如此选择:
若对方选择抵赖,自己选择背叛,会让自己获释,所以会选择背叛。
若对方选择背叛,自己也要背叛,才能得到较低的刑期,所以还是选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的均衡,就是双方都背叛对方,结果二人都服刑5年。这就是博弈论中经典的囚徒困境,可用下表表示。
囚徒困境是博弈论的非零和博弈中具有代表性的例子,反映个人最佳选择并非团体最佳选择。虽然囚徒困境本身属于模型性质,但现实中的价格竞争、环境保护等方面,频繁出现类似情况。