第八节 混合策略——警察如何与小偷斗智?(1 / 1)
第八节 混合策略——警察如何与小偷斗智?
2018-04-15 作者: 孙科炎;董晓孝
第八节 混合策略——警察如何与小偷斗智?
在某个小镇上,有一个警察要负责整个小镇的治安。小镇的一头有一家酒吧,另一头有一家银行。当地有一个小偷,正准备实施偷盗。由于分身乏术,警察一次只能巡逻一个地方;而小偷也只能去一个地方。再假设银行需要保护的财产价格为20万元,酒吧的财产价格为15万元。如果警察在某地巡逻,而小偷也在该地行动,那么就会被警察抓住;如果警察没巡逻而小偷去该地行动,那么小偷就偷盗成功。这种情况下,警察如何巡逻才能使效果最好?
显然,一个比较明智的做法就是,警察在银行这边巡逻,这样就可以确保20万元的财产不被偷窃。但是,如果小偷去酒吧,那么偷窃成功。试想一下:上面这种做法是警察的最优选择吗?还有没有更好的改进策略呢?
实际上,这场博弈涉及了混合策略的问题。那么,什么是混合策略呢?
在中国古代军事家孙子看来,混合策略就是“攻其所不守也,守其所必攻也;敌不知其所守,亦不知其所攻。”在当代学者大卫,吕埃勒的著作中,混合策略就是:“如果你与某人竞争,最佳策略是采取随机的、不可预测的行为。”
而在经济学家眼中,混合策略是博弈论中的一种策略选择法,指的是允许参与人随机选择他们的策略——每项选择都指定一个概率,并按照这些概率进行选择。简单地说,混合策略就是在信息完全的博弈中,给定每个信息的情况下,以某种概率来选择不同的策略。
在上面那个例子中,对于警察来说,一个最优的选择就是:抽签决定巡逻银行还是酒吧。由于银行财产的价格是酒吧的两倍,因此用两个签代表银行,例如抽到1、2号签去银行巡逻,抽到3号签去酒吧。如此一来,这位警察去银行巡逻的概率为2/3,去酒吧巡逻的概率为1/3。类似的,小偷的最佳做法是:以同样的抽签方法决定去银行还是酒吧偷盗,只是抽到1、2号签去酒吧偷盗,抽到3号签去银行偷盗。于是乎,小偷去银行偷盗的概率为1/3,去酒吧偷盗的概率为1/3。这与警察在两地巡逻的概率恰好相反。
案例中警察与小偷之间的博弈,好比我们小时候玩的“石头剪子布”游戏。在这个游戏中,对每个参与者来说,自己采取出“石头”、“剪子”还是“布”的策略应当是随机的,大家谁都不会让对方知道自己的策略,即使是“倾向性”的策略。因为你若被对方知道出某种策略的“可能性”越大,那么你在这个博弈游戏中输的可能性就越大。所以,我们每个参与者的最优混合策略就是采取每个策略的可能性为1/3。在这个博弈中,每个参与者从各种备选策略中选取的随机方式,就是混合策略的体现。
日常生活中,我们不乏听到这样的观点“很多时候,解决问题的最好办法就是不去想怎么解决问题”。因为无论你怎么想,都不会得到一个完美的策略。
举个例子,你和朋友一起喝酒要行拳。行拳的游戏规则是这样的:参与行拳的人每人可伸出1~5个指头,并且口中要说出0~10中的一个数字。如果一方说出的数字正好是两人伸出的指头数之和,而另一方不能准确说出该数字,那么这一方就算胜利,另一方则失败,并且失败者要被罚酒。
在这样一个博弈中,你应该如何出拳?不论你怎样绞尽脑汁,都不会得到一个最优的纯策略。所谓“纯策略”,指的是在信息完全的博弈中,给定每个信息,只能选择一种特定的策略。因此,这种游戏的最好玩法也许就是在大脑中形成一个随机的数列,然后根据这个随机数列来报数。当然,这个随机数列不能事先被你的对手知道。因为只有没有章法可循,对手也就不能通任何章法来战胜你。
↑返回顶部↑