全本小说网 > 都市重生 > 维度修真从蝼蚁到创世 > 第589章 博奕论纳什的均衡突破

第589章 博奕论纳什的均衡突破(1 / 2)

第589章博弈论纳什的均衡突破

代数几何学派离开后,类型空间里那精致的几何图景慢慢淡去,恢复了原本那种混沌中带着秩序的状态。

陈凡几人刚松一口气,还没顾得上说话,整个空间就又不对劲了。

不是那种剧烈的变化,而是悄无声息的转变。

就像你走着走着,突然发现脚下的路分叉了——而且每一条分叉前面又分出新的分叉。不是空间上的分叉,是选择上的分叉。

陈凡要坐下休息,脑子里就冒出好几个选项:坐地上、坐石头上、靠在苏夜离旁边、干脆躺着……每个选项后面,好像都跟着一串预估的结果,什么“体力恢复速度+2”、“苏夜离好感度+1”、“被偷袭概率-5%”之类的。

他甩甩头,幻觉消失了。

但紧接着,苏夜离要说话,她张了张嘴,话没出口,陈凡就感觉脑子里飘过几个可能性:“凡哥你累不累”、“咱们接下来怎么办”、“我有点害怕”——然后苏夜离实际说的是:“凡哥,你脸色不太好。”

冷轩要擦剑,手刚抬起来,陈凡眼前就闪过几个画面:冷轩认真擦剑、冷轩警惕环顾、冷轩闭目养神——结果冷轩真的开始认真擦剑。

“你们有没有觉得……”

林默皱起眉头,“好像有什么东西在预测我们的行为?”

萧九炸毛了:“喵!本喵刚才想挠痒痒,脑子里突然跳出来三个挠法!左边、右边、打滚——最后本喵选了打滚!”

路径构造者身体里的路径开始不规则闪烁:“这是……策略空间展开。博弈论学派来了。”

“这么快?”陈凡站起来,警惕地看向四周。

没有实体出现,但整个类型空间变成了一个巨大的“博弈矩阵”。

就像下棋的棋盘,但格子不是方形的,而是各种形状的多边形。

每个格子里都标着数字、符号,还有些看不懂的博弈论术语:“纳什均衡点”、“帕累托最优”、“占优策略”、“囚徒困境矩阵”……

空气里飘着看不见的“玩家”和“策略集”。

“欢迎来到博弈空间。”

一个声音响起,不是从一个方向来的,是从所有博弈格子里同时传来的。

那声音很平静,平静得有点冷酷,就像在计算胜率时的绝对理性。

“我是博弈论学派的均衡观察者。”

声音继续说,“我们观察一切策略互动。而你们——尤其是你,陈凡——是绝佳的观察对象。”

陈凡深吸一口气:“你们也要测试自由意志?”

“测试?不。”

均衡观察者的声音里带着一丝几乎察觉不到的兴趣,“我们观察。自由意志在策略选择中会展现出什么特性?是会追求个人最优?群体最优?还是会做出非理性选择?这些数据比单纯的‘是否存在’更有价值。”

苏夜离握紧陈凡的手:“他们好像……不像之前的学派那样要审判我们。”

“但更危险。”

冷轩的剑已经出鞘,“他们在研究我们,像研究笼子里的动物。”

林默推了推眼镜:“博弈论研究的是理性决策者在互动中的策略选择。如果自由意志是非理性的,或者超越理性的……那对他们来说可能是个难题。”

“正是如此。”

均衡观察者说,“所以我们需要观察。不过,单纯的观察太被动了。我们设计了一个小游戏。”

话音刚落,陈凡面前出现了一个透明的面板。

面板上是一个经典的“囚徒困境”矩阵:

“玩家A合作,玩家B合作:各得3分”

“玩家A合作,玩家B背叛:A得0分,B得5分”

“玩家A背叛,玩家B合作:A得5分,B得0分”

“玩家A背叛,玩家B背叛:各得1分”

“简单测试。”均衡观察者说,“陈凡,你和苏夜离同时选择。你们不能交流,选择后看结果。”

陈凡看向苏夜离,苏夜离也看向他。

两人之间隔着一层透明屏障,确实没法交流。

这种测试……太经典了。

经典囚徒困境,理性选择应该是背叛——因为无论对方选什么,背叛的收益都大于或等于合作。但双方都背叛的结果比双方合作差。

这是考验信任。

陈凡盯着选项。

他知道苏夜离大概率会选合作,因为她信任他。

如果他选背叛,能得5分;选合作,最多得3分。

但选了背叛,苏夜离就得0分。

他手指动了动。

苏夜离也在思考。

她了解陈凡,凡哥不会坑她。

但这是博弈测试,会不会有深层陷阱?如果自己选合作,陈凡选背叛……

两人几乎同时选择。

结果出来:

陈凡:合作。

苏夜离:合作。

各得3分。

均衡观察者记录:“第一轮:双合作。偏离纳什均衡(背叛,背叛)。原因:情感因素压制理性计算。”

萧九凑过来:“喵?纳什么均衡?”

林默小声解释:“纳什均衡就是一组策略,每个玩家的策略都是对其他玩家策略的最优反应。在囚徒困境里,双方都背叛是唯一的纳什均衡。”

“但他们没选那个!”

萧九得意地说,“这说明凡哥和夜离姐姐感情好!”

“继续。”均衡观察者的声音没有波动。

第二个测试来了。

这次是“猎鹿博弈”。

两个人一起去猎鹿,合作能猎到鹿,每人得4分;但如果有人去抓兔子,抓兔子的得3分,留下猎鹿的得0分;如果都去抓兔子,各得2分。

还是不能交流。

陈凡想,猎鹿需要合作,抓兔子是保底。

苏夜离会选什么?他倾向于合作猎鹿,但万一苏夜离选了抓兔子……

苏夜离也在想同样的问题。

两人选择。

结果:陈凡-猎鹿,苏夜离-猎鹿。

双合作,各得4分。

均衡观察者:“第二轮:双合作。再次偏离风险规避策略(抓兔子是安全策略)。原因:预期对方会选择合作,基于历史互动经验。”

冷轩看着这一幕,突然说:“他们在建立默契。”

“对。”林默点头,“即使不能交流,基于对彼此的了解和信任,他们在重复博弈中会趋向合作。这是博弈论中‘声誉机制’和‘未来阴影’的作用——考虑到未来还会互动,当前合作更有利。”

“但游戏不会这么简单。”

路径构造者说,“博弈论学派擅长设计复杂的策略环境。”

果然,第三个测试变了。

不再是两人博弈,而是五人博弈——陈凡、苏夜离、冷轩、林默、萧九全被卷入。

游戏叫“公共品博弈”。

每个人有10个代币,可以选择投入公共池。

公共池里的代币会翻倍(乘以2),然后平均分给所有人。但如果你不投入,只拿别人的……那更赚。

这是个典型的搭便车问题。

五个人被隔开,各自选择投入多少代币(0到10)。

陈凡想了想。如果大家都投入,那所有人都赚。但如果有人不投或少投,老实投入的人就亏了。团队里……萧九可能不懂,林默可能理性计算,冷轩不好说……

他投了8个。

结果出来:

陈凡:投入8,最终得12.4

苏夜离:投入9,最终得12.8

冷轩:投入7,最终得11.8

林默:投入6,最终得11.2

萧九:投入10,最终得13.0

总投入40,翻倍80,平分每人得8,加上自己留下的,就是最终收益。

萧九居然是投入最多的那个。

“喵?本喵觉得要投就全投嘛!”

萧九理直气壮,“反正大家都会投的!”

均衡观察者记录:“第三轮:团队合作水平较高,平均投入8。偏离理性自利预测(理性预测是投入0)。原因:团队认同感和利他倾向。”

林默苦笑:“我其实是算了算,如果大家都投,我投少点更赚……但最后还是觉得不能太自私。”

冷轩淡淡道:“我信你们会投,所以投了七成。”

苏夜离笑了:“我信凡哥会多投,所以投了九成。”

陈凡看着结果,心里有点暖。这个团队,确实不一样。

“基础测试结束。”均衡观察者说,“现在进入正式观察阶段。你们将面临一个扩展式博弈——‘递归囚徒困境深渊’。”

空间变换。

五个人发现自己站在一个螺旋向下的楼梯口,楼梯深不见底,每一层都有一个博弈选择点。

“规则很简单。”

均衡观察者解释,“每一层,你们都会面临囚徒困境的选择。但有一个关键变化:你们的得分会累积,而下一层的收益倍数取决于上一层的选择结果。”

“具体来说:如果某一层双方合作,下一层的收益乘数+1。如果某一层出现背叛,乘数重置为1。”

“你们要一直向下走,直到选择停止。停止时,总得分=各层得分×该层乘数的连乘积。”

萧九听得头大:“喵……听不懂!”

林默脸色变了:“这是无限递归囚徒困境的变种。理论上,如果一直合作,收益乘数会无限增长,总得分可以趋向无穷大。但只要有一个人背叛一次,乘数就归1,之前积累的放大效应全没了。”

“而且,”冷轩盯着楼梯,“越往下走,收益越大,但背叛诱诱惑也越大——因为只要在很深的层数背叛一次,就能独吞巨大收益。”

苏夜离握紧陈凡的手:“这考验的是……无限信任。”

均衡观察者:“游戏开始。第一层,陈凡对苏夜离。”

两人站在第一层平台。面前还是那两个选项:合作,背叛。

陈凡看着苏夜离,苏夜离也看着他。

“我信你。”苏夜离轻声说,哪怕隔着屏障。

“我也信你。”陈凡点头。

两人同时选择:合作。

第一层得分:各3。乘数变为2。

“第二层,陈凡对冷轩。”

冷轩看着陈凡:“你信我?”

“信。”陈凡说。

冷轩沉默一秒:“那我也信你。”

双合作。得分各3,累计各6。乘数变为3。

“第三层,陈凡对林默。”

林默推了推眼镜:“从博弈论角度,在无限次重复囚徒困境中,合作确实是子博弈精炼均衡,只要未来折现因子足够大……”

“说人话。”陈凡笑了。

“合作。”林默也笑了。

双合作。得分各3,累计各9。乘数变为4。

“第四层,陈凡对萧九。”

萧九跳起来:“凡哥凡哥!本喵肯定合作!全投!”

陈凡笑着点头。

双合作。得分各3,累计各12。乘数变为5。

一轮下来,团队内部全合作。

但均衡观察者的声音响起:“第一阶段结束。第二阶段:外部玩家介入。”

楼梯上出现了新的身影。

不是真人,是“虚拟玩家”——由博弈论学派生成的策略智能。

“现在开始,每一层,你们中的一人将与虚拟玩家对战。虚拟玩家采用各种经典策略:永远合作、永远背叛、以牙还牙、宽容以牙还牙、随机策略等。”

“第五层,苏夜离对虚拟玩家1号。”

苏夜离面前的对手,是一个光影组成的人形,脸上没有表情。

选项出现。

苏夜离想了想,选了合作。

虚拟玩家1号:背叛。

苏夜离得0分,虚拟玩家得5分。乘数重置为1。

“啊!”萧九叫起来,“它背叛了!”

均衡观察者:“虚拟玩家1号采用‘永远背叛’策略。苏夜离得分累计12不变,乘数归1。”

苏夜离脸色一白。她以为……至少第一轮会合作。

陈凡安慰她:“没事,重新开始。”

“第六层,冷轩对虚拟玩家2号。”

冷轩盯着对手,选了合作。

虚拟玩家2号:合作。

双合作。冷轩得3分,累计15。乘数变为2。

“虚拟玩家2号采用‘永远合作’策略。”均衡观察者记录。

“第七层,林默对虚拟玩家3号。”

林默思考后,选了合作。

虚拟玩家3号:合作。

双合作。林默得3分,累计18。乘数变为3。

“虚拟玩家3号也是‘永远合作’。”

“第八层,萧九对虚拟玩家4号。”

萧九想都不想:“合作!”

虚拟玩家4号:背叛。

萧九得0分,累计12。乘数重置为1。

“喵!又背叛!”萧九炸毛。

“虚拟玩家4号采用‘永远背叛’。”

“第九层,陈凡对虚拟玩家5号。”

陈凡看着对手。已经有两个永远背叛者了,这个会是什么策略?

他选了合作。

虚拟玩家5号:合作。

双合作。陈凡得3分,累计15。乘数变为2。

“虚拟玩家5号是‘永远合作’。”

几轮下来,他们摸到规律:虚拟玩家有的是永远合作的老好人,有的是永远背叛的混蛋,策略固定,不会变。

“第三阶段开始。”均衡观察者说,“虚拟玩家将采用动态策略。第十层,苏夜离对虚拟玩家6号——采用‘以牙还牙’策略:第一轮合作,之后复制对手上一轮的选择。”

苏夜离上一轮被背叛了,这次她有点犹豫。

如果选合作,对方也会合作(以牙还牙第一轮合作)。

如果选背叛,对方下一轮就会报复……

她选了合作。

虚拟玩家6号:合作。

双合作。苏夜离得3分,累计15。乘数变为3(因为上一轮陈凡合作,乘数2,这轮合作乘数+1变3)。

“好!”林默握拳,“以牙还牙策略其实鼓励合作,只要你先合作。”

“第十一层,冷轩对虚拟玩家7号——‘宽容以牙还牙’:大部分时候以牙还牙,但偶尔会原谅背叛。”

冷轩选了合作。

虚拟玩家7号:合作。

双合作。冷轩得3分,累计21。乘数变为4。

游戏继续进行。

虚拟玩家的策略越来越复杂:有“两报还一报”(被背叛两次才报复一次)、有“随机试探”(偶尔无故背叛看反应)、有“进化策略”(根据历史胜率调整)……

团队五人艰难地推进。乘数时而增长,时而被重置。得分起起伏伏。

最难受的是,有时候你明知道对方可能背叛,但为了乘数增长,还得选合作——因为只要对方合作一次,乘数就能+1,长期收益更大。