1 min read

基于均值场博弈理论创立的CP505协议在杯赛制中的博弈机制创新


一、引言

在国际公开的大型杯赛体系中,国际上合法博彩集团扮演了制定游戏规则这个重要的角色,对整个体育产业资本都有着举足轻重都影响。每次大型世界赛事,例如世界杯足球赛,博彩公司给出所有参赛球队的赔率,而全球的球迷会根据自己的喜好,选择各自的球队进行投注。[ 1 ] 

这其中的赔率设定涉及到非常复杂的数学分析设定,是整个竞技博弈中的核心。正因为赔率是根据参赛队的实力、球员当前状态、球队历史表现等一系列指标进行加权计算,由博彩公司主观的给出。对博彩公司最理想的状况是任意一个比赛的结果,玩家的筹码胜负结果可以互相抵消,博彩公司赚取无风险的手续费,这是非常理想也是完全正常的商业模式。

然而因为竞技体育存在着很多偶然性,并且球迷会有天然的倾向,在某些时候,涉及到全球关注的重要比赛,全球投注的巨大金额,会出现大量的押注单一方向。结果会导致一旦比赛爆冷,大部分玩家猜错了,博彩集团会有超额收益,少部分压中玩家也会获得巨大收益,但一旦大部分玩家压中,博彩集团将面临巨额赔付。

尽管今天的赔率制度已经发展到了非常复杂的数学模型以及通过互联网实现了实时调整赔率的动态机制,但有时候球迷对某些球队对喜爱是会严重影响真实实力对。很多极端的情况,会导致博彩集团面临风险。例如 2014 年世界杯半决赛德国对巴西,两个队排名和水平接近,理论上赔率应该相差不大,但巴西有主场优势,并且 2014 年的巴西队群星闪耀,得益于互联网在全球的快速发展,使得巴西队拥有海量的热爱者,这导致当时出现了历史罕见的一边倒押注,绝大多数的筹码都放在巴西最终获胜晋级决赛上面,博彩公司面临大赚和大亏的两难选择,被迫成为绝大多数资金的对手盘,这对任何博彩集团来说,都是不可接受的。虽然没有证据表明比赛被操纵,但在历史上这次比赛中,德国队在巴西主场以 7 : 1 的比分,大胜具有主场优势的夺标最大热门巴西队,获胜晋级,这个赛前无法想象的比分也几乎没有玩家猜中。从结果来看,博彩公司是最大的获益者。而在国际所有赛事中,球迷都总结出一个没有科学依据的规律,“大热必死”,但其实这背后是由于零和博弈带来的巨大风险,让“大热”的队伍“死亡”是降低商业风险最无奈的办法。而这条朴素的,由球迷们总结出来的规律是如此的不符合概率学,也间接证明了,存在信息不对称干预比赛的结果。

传统的博彩集团,虽然从商业模式上,不是以下场参与对赌为目的,但单纯的赔率投注方法,一定有概率需要博彩集团赔出更多的赌注,想要从源头上遏制人为干预比赛,绝不是制定法律法规严格执法去杜绝人为干预,而是需要从机制上改变传统的由庄家主动给出赔率的博弈方式。随着区块链技术的日益成熟,利用区块链技术的透明性、去中心化性、可编程性,能够实现让游戏规则不可被任何人篡改,通过多个标准协议的组合,本文提出了一种基于均值场博弈理论的全新博弈合约 CP 505 协议。

二、相关工作

2.1  均值场博弈理论 (Mean Field Games, MFG)

Pierre-Louis Lions 等人在 2006 至 2007 年提出的均值场博弈理论[ 2 ],为大量同质智能体参与的博弈提供了均衡解。该理论在数学上描述了在大量参与者的系统中,个体如何基于其他参与者的统计学上的行为来做出最优决策。

2.2 博弈论 (Game Theory)

博弈论[ 3 ]是研究具有冲突和合作特征的决策者之间互动的数学理论。它为理解和预测赛会制博彩游戏中的策略行为提供了框架。

2.3 市场机制设计 (Market Mechanism Design) [ 4 ]

市场机制设计关注如何设计市场规则以实现特定的经济目标,如效率、公平性和透明度。

2.4 加密货币和区块链技术 (Cryptocurrency and Blockchain Technology)

加密货币和区块链技术提供了一种去中心化的价值转移机制,它为创建透明和不可篡改的博彩游戏平台提供了技术基础。[ 5 ]

2.5 行为经济学 (Behavioral Economics)

行为经济学结合了心理学和经济学,研究人们在经济决策中的非理性行为,这对于理解和设计博彩游戏的用户互动具有重要意义。[ 6 ]

2.6 赛会制博彩市场分析 (Tournament Betting Market Analysis)

对赛会制博彩市场的分析,包括赔率设定、市场流动性和信息效率,为设计博彩游戏提供了实证研究基础。[ 7 ]

2.7 囚徒困境

一个经典的二人非合作博弈模型,其中每个参与者的从个体最优选择出发的决策,导致了对所有参与者都较差的结果。这个概念最早由阿尔伯特·W·塔克在 1950 年提出。[ 8 ]

2.8 多人博弈的计算困难性

随着博弈参与者数量的增加,找到均衡解的难度显著增加。这是因为博弈的策略空间随参与者数量呈指数增长,导致计算均衡变得更加复杂。[ 9 ]

2.9 多人博弈的均衡

在多人博弈中,纳什均衡可能不存在或难以找到,这是因为每个参与者的最优响应策略依赖于其他所有参与者的策略,而每个人的策略选择空间都很大。[ 10 ]

三、理论基础与模型构建

3.1 均值场博弈理论在假设中的应用

如果用户的每一份投注都可以变成无数的碎片进行交易,由市场来对碎片自由定价,而这些碎片又能自由的实现全新的投注,这就将传统的赔率方式,转化为了一种金融方式。而问题从分析研究用户的投注问题,转化为分析用户的金融行为,进而转化为近乎无限的同质对手的博弈策略问题。

在经典的博弈论中,游戏发生在场景中的对手之间,通常只涉及两个人,比如著名的囚徒困境问题。涉及三个对手的游戏在计算上是非常困难的,很难达到均衡,这就是为什么西部片《好人、坏人和丑陋的人》如此经典。如果参与游戏的人数达到四个、五个或更多,从数学上来说是无法解决的,这里面所说的无法解决,是指没有所谓的最佳策略,因此游戏的参与人无法采用趋同的策略。

然而,如果游戏中的对手数量可以被认为是无限的,从数学上来说是有解的。法国数学家、菲尔兹奖得主 Pierre-Louis Lions 和其他几位数学家在 2006 年至 2007 年提出均值场博弈理论,对于一个近乎无限的同质对手参与的游戏,可以从数学上得到均衡状态下的概率分布,从而得到游戏参与者在均衡点处的最佳策略。

当均值场博弈理论在刚开始被提出时,人们并没有认为这个理论在金融领域有任何应用。建立均值场博弈理论的前提是游戏的对手是同质的,而在传统金融市场中,游戏对手的能力和类型完全不同,有具有内幕知识和实际执行力的公司管理层,有机构和大账户,还有许多个人投资者,正因为游戏的对手不同质,所以总是存在操纵,例如股价不是一个公平博弈的结果,掌握内幕消息的大股东或者管理层,或者看清了筹码分布的大资金,这些通常是股价的操纵者。

3.2 均值场博弈理论

均值场博弈(mean field game,MFG)理论专门探讨数量庞大的智能体(agent)在竞争环境下所使用的策略,每个智能体都会因应身边其他智能体所采取的行动而随之应变,务求令自可获得最大利益。

智能体的假设通常包括以下几点:

  • 1.同质性:所有智能体都是同质的,即它们具有相同的偏好和决策能力。

  • 2.大量智能体:系统中存在大量的智能体,以至于单个智能体的行为对整个系统的影响可以忽略不计。

  • 3.相互作用的简化:智能体之间的相互作用通过智能体行为的平均效应(即均值场)来简化表示,而不是通过个体间的直接相互作用。

  • 4.连续时间:智能体的行为和决策过程通常在连续时间框架下进行建模。

  • 5.理性:智能体被假设为理性的,即它们会根据自身的利益最大化目标来选择最优策略。

  • 6.信息结构:在某些模型中,智能体可能具有不同的信息结构,例如完全信息或不完全信息。

  • 7.策略选择:智能体会根据其他智能体的平均行为来调整自己的策略,以实现个体效用的最大化。

  • 8.稳定性和均衡:智能体的行为会趋向于某种均衡状态,如纳什均衡,这是 MFG 理论分析的重点之一。

  • 9.分布式决策:智能体的决策过程是分布式的,没有中央协调机构。

3.3 构建类似智能体假设

在传统赔率制中,由于赔率是博彩公司制定的,所以,所有的球迷投注,仅仅是出于自己对球队的喜爱程度或者客观估计,以及博彩公司制定的赔率是否存在套利空间,大部分用户的个人行为是无法影响其他人的行为,而其他人的投注行为,也不会影响我的投注行为。而当由于大量用户的行为导致赔率有变化时,投注用户也不能撤回投注,改变自己策略,一旦下定之后,就没有任何反悔的机会。这就不符合均值场博弈的假设。

但当应用区块链技术和智能合约技术,允许每一个用户将自己的投注都可以碎片化,形成强流动性的交易品,由市场用户二次决定碎片价格,进而间接实现用户改变自己的策略,进而影响他人的策略,这些用户的行为,就非常接近均值场博弈理论中的智能体的行为。

一旦我们的模型能够有机会使大量参与用户成为近似的智能体,那么,根据均值场博弈理论,是有可能会有最优解出现的,这个最优解往往是一组复杂的纳什均衡。

3.4 纳什均衡特点概述

  • 1.非合作性:在非合作博弈中,每个智能体独立选择自己的最优策略,不考虑其他智能体的利益。

  • 2.策略组合:纳什均衡是所有智能体策略的一个特定组合。在均衡状态下,每个智能体的策略是对其他智能体策略的最佳响应。

  • 3.稳定性:纳什均衡是一种稳定状态,即在没有外部干预的情况下,没有智能体会从改变自己的策略中获益。

  • 4.预测性:在博弈论中,纳什均衡提供了一种预测博弈结果的方法,因为它代表了一种自我强化的策略状态。

  • 5.可能的多重均衡:在某些博弈中,可能存在多个纳什均衡,每个均衡都代表了一种可能的博弈结果。

  • 6.理性假设:纳什均衡的成立基于智能体是理性的,即它们会根据自身的利益最大化目标来选择策略。

  • 7.效用最大化:在均衡状态下,每个智能体在给定其他智能体策略的情况下,选择了能够最大化自己效用的策略。

3.5 假设模型的理论框架

大量玩家参与的博彩游戏,在没有庄家的情况下,这些大数量的玩家属于同质智能体,符合均值场博弈的成立条件。同时这些玩家无法与数量众多的其他玩家达成合作博弈,因此均值场博弈也属于非合作博弈。

纳什均衡带给我们一个重要的价值,也就是在这个模型下的所有用户不再是一种“赌博”,因为用户在非合作条件下,如果他是理性的,只能采取某个确定的策略,或者叫支配型策略,这个策略对自己最有利。纳什均衡通常对小数量的玩家有效,理性玩家都采取支配型策略,达成了某种均衡。均值场博弈与纳什均衡的前提都是非合作博弈,均值场博弈所达成的均衡可以理解为无数个纳什均衡的组合结果。

传统的赔率博彩,只能是在给定赔率下的零和博弈,一旦最大的参与方(博彩集团)发现有巨额赔偿风险,就极有可能通过各种方式干预比赛结果,进而出现极大的不公平。而在 CP 505 协议下的新博弈模型,是有机会让用户自己选择策略,并且能够实现多重策略,每一步的决策都会影响他人,无数的智能体最终有机会实现纳什均衡,实现最优解。而这个最优解并不是让所有用户都盈利,而是在公平和透明的前提下,所有用户都已经根据自己理性决策,充分的,自主的,实现了自己的策略,这是一种全新的博弈设计,而不再是传统的“赌博”。

在一个杯赛的赛制里面,每轮比赛的结果出来之后,所有的玩家都收到了同样的条件改变的信息,玩家根据条件的改变,和观察其他玩家的行为,重新确定自己的策略并去执行。在每轮结果确定之后,根据各个队伍的继续生存的概率,以及玩家自由交易产生的各个队伍成为最后赢家的赔率,采用均值场博弈的理论的数学公式,可以计算出来理论上的均衡值,这个均衡值是一系列队伍以及筹码的定价。玩家的情绪可能会让实际的定价与理论定价产生偏移,理性的交易者(套利者)会交易这个偏移,使得实际定价趋向于理论定价。一个市场里面同时存在套利者和有情绪偏好的交易者,会让市场产生足够的交易,对市场的活跃度有利。

3.6 基于 CP 505 协议的博弈模型假设

基于以上分析,CP 505 协议的博弈模型设计要充分考虑到以下假设:

  • 1.所有比赛信息都公开透明

  • 2.所有玩法规则不可被任何人篡改

  • 3.即便比赛结果有差别也不会影响博弈策略

  • 4.没有中心化集团有能力干预任何规则设置,即便干预了比赛,也对群体性策略没有影响。

  • 5.每个参与者是同质的,他们都追求最高回报率而非“赔率”,他们均可以根据其他参与者的策略,反复调整自己的行为。

  • 6.单一智能体行为对整个系统的影响微不足道。

  • 7.要由充分的市场竞争以及流动性,决定市场价格,该市场价格是所有参与者经过反复博弈动态变化的,它的变化,表现了市场内所有智能体的状态及策略的概率分布。该市场定价被视为一种均值场博弈所产生的均衡结果。

3.7 区块链技术及智能合约对模型的技术保障

区块链技术以及以以太坊为基础的智能合约技术,可以实现所有的数据都公开可查询和追溯,利用去中心化、分布式的记账网络,可以将程序在全部网络节点记账,任何人都没有能力篡改已经形成的规则。

3.8 构建模型

  • 1.将所有参赛队伍的投注转化为基于 ERC 721 协议的 NFT 资产。该资产也可以实现去中心化交易。

  • 2.用户购买任何一个队伍的 NFT,即代表一种特殊类型的投注。

  • 3.所有投注不被任何中心化集团掌控,交于智能合约保管,由智能合约分发给最终胜利者。

  • 4.基于 CP 505 协议的设置,所有 NFT 均可以销毁并转化为 ERC 20 通用型代币。但每次销毁 NFT 所获得的 ERC 20 代币均有一部分进入黑洞地址永久销毁。

  • 5.该代币基于自动化做市商(AMM)模型在去中心化交易市场交易,避免任何人为干预。

  • 6.一定数量的 ERC 20 代币可以重新合成某个球队的 NFT 卡,意味着重新投注,一般可以随机生成,如果用户不满意随机生成的队伍,还可以再次销毁 NFT,获取代币,再次生成。

  • 7.每一个用户根据自己的决策去销毁及合成,均会导致代币的持续性销毁,进而影响该代币在二级市场的价格。而该市场的买方需要购买代币合成新的参赛队伍卡,而卖出代币的卖方需要通过代币的销售,减少损失,甚至通过低买高卖来减少自身风险。该市场价格将是一个持续的均值场博弈所形成的价格。而用户的反复的,自由的,理性的销毁和生成 NFT 的过程,是个体自由选择策略的充分表现。

  • 8.在比赛决赛之后,所有持有冠军队的 NFT 卡的用户,均分合约中的所有投注额。理论上,每一个用户都可以在决赛之后,有充分的时间去合成冠军的卡片。

  • 9.该模型实现的最终结果,在数学表达上是一系列均值场博弈所产生的均衡价格。

四、CP 505 商业设计方案

假设:市场上有大型比赛项目 36 个队伍争夺冠军。比赛为期 1 个月。已经充分知晓 36 个队伍是哪些队伍,比赛结果是物理世界公共事件,有唯一确定性。理论上任何竞技类均可以实现该假设。

第一个 NFT 盲盒。每个盲盒随机产生五个队伍的投注。每个投注是完全一致。比如一个盲盒 100 美元,则随机开出来的五个队伍 NFT,每个 NFT 价值 20 美金。这 20 美金即可认为是投注。

NFT 交易市场,热门球队的交易价格会上涨,一直到形成一个均衡的价格。冷门的球队因为没有购买需求,理论上价格会下跌很多。这是第一个市场博弈均衡。

根据 CP 505 协议的机制。NFT 可以销毁并产出固定的 ERC 20 代币—V-Token,然后用 V-Token 重新合成盲盒,这样的好处是用户有机会获得自己相对满意球队的 NFT 筹码。

销毁 NFT 所产生的 V-Token 由智能合约控制,将其中的 10% V-Token 在去中心化交易市场卖掉并打入总奖池。增加用户总奖金。将另外 10% 的 V-Token 打入黑洞地址进行销毁。

最终冠军球队 NFT 的持有者分享奖池。

玩家策略思考

对于参与者来说,他可以采取的行为包括但不限于以下策略

  • 大量购买盲盒获取热门球队卡,淘汰没价值球队卡,合成新的盲盒,逐渐让自己手里的球队卡变成夺冠卡,获取奖金

  • 卖掉价格被炒高的热门球队 NFT,买入他看好的球队 NFT,获取 NFT 投资收益。

  • 碎裂自己不看好的球队 NFT,产生 V-Token,他可以选择卖掉,回收一些成本,或者用 V-Token 重新合成盲盒来继续追求博弈的偶然性。

  • 随着小组赛或者淘汰赛的进行,每个球队 NFT 的价值都会变化,这个价值的变化的驱动因素来源于比赛结果的随机性。随着球队 NFT 价值的变化,又会驱动参与者采取他认为合适的行为,或者买入/卖出球队 NFT,或者碎裂 NFT/合成盲盒。

  • 玩家也可以观察 V-Token 的价格,随着被淘汰队伍的增加引起碎裂的增加,V-Token 的价格可能会因为购买量的不足,而低于理论价格,玩家购买 V-Token 合成新的 NFT 会带来额外收益。同样,如果因为总奖池价值的增加,引起玩家购买 V-Token 的投机性需求增加,会带来 V-Token 价格超过理论价值的状况,这时候抛售还未被淘汰但夺冠希望不大的队伍 NFT 碎裂所产生的 V-Token 可能有利可图。

五.开源智能合约代码

该代码的编写得到新加坡独立商业团队 euro 505 小组的部分支持,他们根据本论文做了基于欧洲杯的社会实验,其实验数据我们将在下一篇论文中进一步给读者展示。

六、结论

基于区块链技术构建的 CP 505 协议为所有杯赛制的赛会开创了一种全新博弈思路,它的理论依据来自于均值场博弈、纳什均衡、行为经济学等理论,在技术上,必须以完全去中心化,并且公开透明、不可篡改的区块链技术以及诸多去中心化的 NFT 交易市场和去中心化代币交易市场的产业配合才能实现。在这个相当于无限多同质的个体参与的游戏中,所有的信息公开透明,用户可以反复修改策略,进而影响其他人策略,最终实现在任何一个短暂的均衡状态之下(下一轮比赛的结果的随机性还未产生),理论上所有用户共同决定了最优策略,这个最优策略的直接体现就是价格(包括球队 NFT 价格,以及 V-Token 价格)。

因为玩家总是存在各种偏好与情绪,所以交易产生的价格,可能与理论上的均衡价格存在偏差。这时候会有理性的套利者交易这个价格偏差,高卖低买,从而使交易价格最终趋向于理论价格。所有的价格是市场上玩家的情绪偏好者与理性的套利者通过交易产生的,不是被操控或者黑幕产生的,套利玩家与追求个人对参赛队伍偏好的玩家的不同目的,和采取的不同策略,会增加市场的活跃度,让市场更加健康。

从另一层意义上来说,这种规则的设计,是在科技创新之下,人类试图利用数学的博弈论,打破传统赔率型博彩机制,实现一种不以赌博为目的,而是以投资为目的的全新博弈乐趣。

由于作者们能力有限,所有的设计思考及开发工作都有不足之处,愿本研究能够为更多的学者带来启发,也愿意接受任何学者们的批评和指正。

参考文献

[ 1 ] Asch, P. ( 2017). “Mathletics: How Gamblers, Managers, and Sports Enthusiasts Use 

Mathematics in Twenty-First-Century Baseball.” Princeton University Press.

[ 2 ] Lions, P.-L. ( 2007). “Mean field games.” In: J. Math. Sci., Vol. 177, No. 3, pp. 415-430.

[ 3 ] Nash, J. F. ( 1950). “Equilibrium points in n-person games.” In: Proc. Nat. Acad. Sci. 

USA, Vol. 36, No. 1, pp. 48-49.

[ 4 ] Myerson, R. B. ( 1981). “Optimal auction design.” In: Mathematics of Operations 

Research, Vol. 6, No. 1, pp. 58-73.

[ 5 ] Nakamoto, S. ( 2008). “Bitcoin: A peer-to-peer electronic cash system.” 

In: Bitcoin.org.

[ 6 ] Kahneman, D., Tversky, A. ( 1979). “Prospect theory: An analysis of decision under 

risk.” In: Econometrica, Vol. 47, No. 2, pp. 263-291.

[ 7 ] Forrest, D., Simmons, R. ( 2006). “Betting markets: A survey.” In: Journal of 

Prediction Markets, Vol. 1, No. 1, pp. 2-31.

[ 8 ] Tucker, A. W. ( 1950). “A Two-Person Dilemma.” In: Psychometrika, Vol. 17, No. 2,

pp. 186-202.

[ 9 ] Leyton-Brown, K., Shoham, Y. ( 2008). “Multiplayer Games.” In: Essentials of Game 

Theory: A Concise, Multidisciplinary Introduction, pp. 97-120. Morgan and Claypool.

[ 10 ] Nash, J. F. ( 1951). “Non-Cooperative Games.” In: Annals of Mathematics, Vol. 54, 

No. 2, pp. 286-295.)

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注