策梅洛定理 柯西不等式基本公式


回合制游戏中如何平衡先手优势?

策梅洛定理 柯西不等式基本公式

_本文改编自知乎用户 Xylitogum 在问题“关于回合制游戏的先手优势有哪些平衡手段?”下的回答,游戏葡萄已获转载授权。_
在回合制游戏中,先手玩家通常拥有行动上的优势。为了保证游戏的公平性和趣味性,开发者需要采取措施来平衡这种优势。
策梅洛定理指出,在信息完全、规则明确的二人有限博弈中,先手或后手玩家必然存在获胜或不败的策略。
回合制游戏的目标通常可以分为两类:
- 率先达成目标: 例如,率先将对手生命值降至零,率先集齐特定道具等。
- 尽量多得分: 例如,在规定时间内尽可能多地击败对手,在有限回合内获得更高的分数等。
由于先手玩家可以率先采取行动,因此在大多数情况下更容易获得优势。

策梅洛定理 柯西不等式基本公式

我们可以将回合制游戏分为行动主导和反制主导两类:
行动主导:
- 玩家的行动回合被视为宝贵的资源。
- 玩家的大多数行动都直接关系到游戏目标,并且可以量化。
- 通常存在先手优势。
反制主导:
- 玩家根据对手的行动进行反制。
- 玩家的行动未必都对胜利有贡献,有时甚至会起到反作用。
- 很多情况下存在后手优势。
为了平衡行动主导型回合制游戏中的先手优势,可以采取以下策略:
思路一:“让数字说话”
- 减少初始资源与选择空间: 例如,在卡牌游戏中,让后手玩家拥有更多的手牌。
- 计分惩罚: 例如,在围棋中,使用“贴目”制度来平衡黑棋先行的优势。
思路二: “行动不是全部”
- 让先手需要外部资源投入: 例如,在宝可梦游戏中,引入“速度”属性,玩家需要权衡先手优势与其他属性之间的关系。
- 增加反制玩法: ...

上述提及的非对称游戏中,许多都后手方拥有显著优势。原因在于此类游戏中策略互克,使得后手方可以研究先手方的策略,并实施针对性调整以取得优势。倘若将主动行为和反制行为的想法结合起来,让双方都无法获得优势呢?

在 Dota 2 职业比赛的英雄选择环节,采用的便是类似策略。双方以 2-2-1 的顺序轮流禁用(ban)指定英雄并选择(pick)特定英雄,如下图所示:

诚然,如果假设英雄之间仅存在绝对强度差异,无论如何调整 ban-pick 顺序,先选的一方始终占优。但 Dota 2 巧妙的英雄设计促使玩家在选择英雄时不仅要考虑强度差异,还需要考虑英雄之间的特长协作制约关系,以及双方对英雄熟悉程度的不同都会影响 ban-pick 时的抉择。如此一来,职业比赛的英雄选择环节将不再是纯先手或运气主导,比赛的观赏性在赛前英雄选择中便得到充分体现。

思路三:“让游戏变得不可预测”

随机性:

与信息不透明度思路一致,在游戏中增添随机性可以提升结果不可预测性,从而降低它与玩家初始先后手状态的关联。随机性如同双刃剑,过度使用会导致游戏变成纯粹靠运气的角逐,显著降低策略带来的乐趣。务必要记住,随机性本身不一定改变游戏的对称性,但它可以弱化因对称性带来的单方面最优解选择,给最优解的执行带来一定阻碍。

策梅洛定理 柯西不等式基本公式

在全球流行的桌面殖民地建设游戏《卡坦岛》(Settlers of Catan)中,掷两个骰子的点数之和决定玩家获取资源。初始两个基地的位置也遵循从前到后和从后到前的顺序,防止先行玩家垄断控制有利资源点。

另一个提到随机性不得不说的例子便是《炉石传说》。在这款游戏中,从抽卡到效果发动无处不充满着随机结果的干扰,从抽 3 张牌再从中选 1 张牌的发现机制也是随机性和决策的结合,更极端的例子如尤格萨隆,如此极端的随机性表现甚至可能直接左右比赛胜负。

在这样的游戏中,随机性让局势充满变数,使后手玩家相信先手优势并不恐怖,也让每局比赛都充满期待。但如前文所述,过度的随机性会让玩家失去自主感,让游戏的成败变得类似听天由命的焦虑过程,需要仔细琢磨;随机性与反制链结合不当,也会让游戏变成如石头剪子布般纯粹在开局定胜负的游戏。

提升游戏深度:

策梅洛定理假设双方都为“完美玩家”,但在现实游戏中,先手优势的大小不仅取决于潜在收益,还取决于玩家的实际操作能力。此处游戏的“深度”一词特指技能深度,尤其针对虽然存在最优解,但由于技能限制而无法完美实施的情况。

举个例子,足球和篮球等体育比赛是否存在先手优势?足球也是确定性信息透明的游戏,但没有人能保证自己能完美控制身体(可以通过训练提升),球权更迭非常频繁。双方在很多时候较量的便是身体控制能力,虽然先获得球权的优势存在,但在绝大多数情况下都不足以扭转比赛的战况——更不用说半场过后会更换另一队开球。

类似地,在国际象棋中,先行白棋也普遍拥有 2%-5% 的胜率优势。但由于决策树的深度和复杂度,国际象棋先手必胜与否目前仍然处于猜想阶段,更别提让肉体凡胎思考和执行了。即使对先手优势没有实质性平衡手段,国际象棋的平衡性也处于玩家普遍可以接受的范围内。

策梅洛定理 柯西不等式基本公式

反之,深度较浅的游戏先手优势将被放大。比如井字棋游戏,由于深度太浅且没有随机性,大多数玩家很容易找到最优解并轻松实现。在这种情况下,先手优势不仅很大,而且很容易发现并执行不败策略,因此现在成年人娱乐对弈活动几乎不会考虑井字棋。

延长游戏时长:

假如无法对游戏规则进行大刀阔斧的改革,该如何进一步限制先手优势呢?

一种方法便是轮流进行,在一定局数后判定总体胜负,如同斯诺克比赛需要进行十几局甚至三十几局才能分出胜负。这样既能降低随机性对结果的影响,还能削弱先手优势。缺点是会严重放缓游戏节奏,同时依旧无法对单局比赛的体验产生影响。

除此之外,还可以拉长单局游戏的时长,像《文明》系列那样一局能持续数百个回合,让游戏的中后期弱化前期先手的影响(至少是心理影响)。但同样会严重放慢游戏节奏,对于不确定性较低的游戏而言,甚至无法达到削弱先手的效果。

信息不透明度:

同样是回合制纸笔游戏,《战舰》的先手优势就远不如井字棋那么明显(但仍然存在)。在《战舰》中,由于双方自己的海域布局对对手不可见,玩家需要轮流猜测敌船位置来决定炮击选择。

策梅洛定理 柯西不等式基本公式

显然,如果将《战舰》的海域布局改为对双方完全公开,那么这款游戏的先手将变成必胜——先手可以优先击沉敌方所有船只。但考虑到初始阶段玩家实际上只有约 1/3 的概率命中有效目标(事实上等价于引入随机性),先手并不能保证先手优势的转化,只有少数极端情况下先手快一步击溃对手才会体现优势。而可以通过一个小小的规则修改来避免这一问题,并达到完美的对称性:

先手击沉对方所有船只后,还允许后手进行一次炮击;如果后手也因此击沉了所有敌船,则该局游戏为平手。