在实际的通信网络中, 网络服务提供商(internet service providers, ISPs)通过正式和非正式的关系广泛协作, 合作模式一般是基于网络流的商业合同, 这些网络流横跨全球路由系统中的各个自治网络.每个ISP都定期地优化其连接策略, 来提高利润空间并提升用户满意度.然而, 通过互联网向用户提供各种应用服务(over-the-top, OTT)使得ISPs之间的连接关系变得越来越复杂.因为互联网中心正在向移动终端用户转移, 为了给终端用户提供有效而丰富的内容服务, 网络内容提供商(internet content providers, ICPs)需要从ISPs处购买网络接入服务.事实上, 尽管网络内容能够传递到用户, 由于运营商之间合作不充分而导致的链路连接不畅, 其满意度依然不能被满足.
与此同时, 互联网中存在着数以千计的ISP, 每个ISP都想要最大化自己的收益.目前大多数网络服务供应商都保持着物理上的连接, 而实际中却由于相互之间合作机制不畅而发生阻塞.如果把通信市场看成整体, 每个ISP都应该与同属性个体合作, 一方面提高网络基础设施的有效利用率, 一方面提高整体对于ICPs的议价能力.事实上, 很多国家和地区的通信市场都呈多寡头竞争局面, 缺乏有效的合作机制, 个体逐利造成了大量资源的重复部署和不完全利用, 更严重的是, 有些ISPs可能在路由和互联中采取自私行为, 使得网络系统的整体性能退化.
基于以上情况, 本文研究并提出通信网络中多方参与者的演化博弈机制[1], 讨论互联策略的动态变化过程, 研究如何激励ISPs自发采取与他人合作的策略, 并提供给终端用户良好的网络服务体验.
大多数网络经济学的研究都采用经典博弈理论.均衡理论假设行为主体没有选择偏好并且完全理性, 是一种非常严格的单调性.然而, 演化博弈理论[2]允许更丰富的动态性, 可以弥补经典博弈理论的不足.重复博弈理论[3]研究下述场景中可能发生的相互关系:a)现在的选择影响其他人的选择和自己未来的机会, 并且b)需要把现有的选择考虑进去再做出选择.以下2种情况, 只要有1种成立, 基于自然选择的博弈就不成立:1) 由于不能可靠评估现在的行为引发的未来间接结果导致b)不成立, 最后只对当前直接结果做出回应;2) 由于没有单独个体对他人产生明显的影响导致a)不成立, 类似于竞争市场中对于标准价格的假设例证一样.
参照Friedman等[4]的定义, 演化博弈分析得到的稳定状态满足3个主要特征:1) 单调性:高支付策略代替低支付策略, 即适者生存. 2) 惯性:种群根据环境实时改变行动, 即演化而非革命. 3) 违背自然:参与者不会影响他人的选择, 即自然选择.实际上, 通信市场中的服务提供商和内容提供商两大群体在演化过程中, 其个体行为便为有限理性.鉴于这样的行为特征, 采用自然选择的演化博弈理论作为分析方法.把博弈论和动态演化过程结合起来, 假设种群集合中的个体通过模范、学习、突变或其他方式达到演化稳定平衡点.结果表明合作机制不仅有利于各演化阶段形成互助联盟, 同时避免了网络资源的浪费, 并且支持在现有的互联网之上提供区分服务.
很多网络通信领域的研究专注于网际间互联和网络定价模型.Richard等[5]研究了Shapley只在ISP利益分配中的应用以及结构拓扑下的Shapley解决方案, 开发了动态编码程序来计算一般拓扑结构下的Shapley解.Bailey等[6-7]调研了现存的网际连接关系, 把现有的模型和通信产业的模型进行了比较.非合作博弈[8]被用于模拟网络实体中的自私路由行为.派生于微观经济学, 博弈论也被用于处理网络领域的定价问题和激励机制[9].尽管定价机制能够用来鼓励独立的个体并提高社会福利, 但传统的分析方法是静态并且有限理性的.正如苏辉等[10-11]关于ISPs利益分配研究的博弈,张春燕等[12]针对多方网络服务费用的博弈,以及Varian等[13-14]针对灵活市场定价的博弈.实际上, 动态定价有根据网络状况自动使用价格变化的优点, 但研究者没有考虑实际应用中的网络拓扑行为.本文研究不同场景下的演化博弈过程, 提出了一种基于运营商之间连接关系的动态演化博弈分析方法, 不仅激励ISPs之间充分合作, 还能够最优化利用公共资源, 对于ISPs通过合作提出创新策略也是一大促进.
1 网络模型Faratin等[5]按照功能把ISP分为3个类别:面向内容供应商的ISP、面向终端用户的ISP、承担传输功能的ISP.为了接入互联网, 大部分ISP都必须向其他ISP支付流量传输费, 而通常供应商所选策略与其经济利益密切相关.换一个角度来看, 如果以一家网络运营商为分析粒度, 该公司将包含以上全部3种类型, 其本身又可以看作更细粒度的基本ISP联盟.
考虑到分析的合理性, 在此提出3点假设.
假设1 由于终端个人用户一般从属于某个运营商, 议价能力不强, 使用状况相对稳定, 因此运营商间的合作并非影响其资费收入中终端个人用户贡献部分的主要因素.假设每个ISP有固定规模且非弹性的终端个人用户, 主要研究运营商间的合作对其资费收入中ICPs企业用户贡献部分随时间变动的影响.
假设2 由于文章主要研究基于合作机制的演化博弈, 不考虑价格战因素带来的影响.假设每家运营商向ICP采用统一的收费标准, 当通过合作进一步提高链路质量后, 运营商同等程度地提高ICP的收费标准.
假设3 为了把内容传递给所有的网络用户, 每家ICP都必须与所有运营商保持连接.故这里假设存在M个ISP联盟和N个ICP联盟, 以运营商集团为粒度, 其内部的ISPs在拓扑结构上彼此全连接, 每个ISP为N个ICP提供连接服务, 每个ICP需要支付M倍网络服务费.
这里需要指出, 参考Friedman等[3]所论述的演化博弈场景, 由运营商个体构成的生态系统, 其演化博弈过程包括:1) 确定数量的ISP博弈主体, 2) 有限的策略集合, 3) 周期性的博弈阶段和动态调整过程.在演化过程中, 高收益的策略组合将替代低收益, 持续的动态变化将影响不同策略的收入.定义所研究的网络通信市场(生态系统)包含M个ISP, 由其中任意个体所组成的子集(种群)称为一个ISP联盟.每个联盟都可以看作能够为ICP提供独立接入服务的子网络.
文中主要变量及含义如下:α表示合作双方均投入建设, 向其中一方付费的ICP数量占总体的比率;β表示合作双方均投入建设, 向其中另外一方付费的ICP数量占总体的比率;δ表示一方投入建设, 一方不投入建设, 向投入一方付费的ICP数量占总体的比率;链路状况系数定义为θ;初始连接状态下, 对ICP的流量定价为P0;双方合作状态下, 对ICP的流量定价为P(θ);第x个内容提供商共计有Nx个应用, 每个应用的平均占用带宽为B;初始定价下, ICP需要付费的总带宽BCP;2个ISP间链路带宽的最大承受能力Lmax;维护链路畅通所需要付出的单位维护成本Cunit;维护链路畅通需要付出的总成本Ctotal.
![]() |
图 1 不存在寡头间合作的网络通信市场 Fig. 1 Telecom market without inter-oligach cooperation |
![]() |
图 2 存在寡头间合作的网络通信市场 Fig. 2 Telecom market with inter-oligach cooperation |
如上文所述, 中国的三大网络服务供应商经营各种业务, 尽管省级或地区级分公司独立运营, 其财务营收依然以集团为单位, 那么, 以不同属性的利益集团为粒度, 一家运营商的网络服务费收入由ICP企业用户和终端个人用户两部分组成.根据假设, 个人用户规模固定, 故Ruser为常量.规定ICP的通信费也按照应用软件的使用流量来收取, 通过绑定内容和流量来吸引锁定目标用户, 即运营商根据不同的应用类型尝试差异化的定价结构, Rcp为所有移动应用网络服务费的总和.
$ {R_{{\rm{total}}}} = {R_{{\rm{user}}}} + {R_{{\rm{cp}}}} = {R_{\rm{u}}} + \sum\limits_{x = 1}^n {\left( {{N_x}\bar B\theta } \right)} $ | (1) |
运营商的成本包含诸多因素, 例如基站的数量, 用户的地理位置分布, 电力消耗等.这里把成本分为固定成本CF和可变成本CV两部分, CF为运营商已经投入基础设施建设的沉没成本, CV随着ISP对链路管理维护投入力量的加大而增加.
$ {C_{{\rm{total}}}} = {C_{\rm{F}}} + {C_{\rm{V}}} = {C_0} + \theta \bullet {L_{\max }} \bullet {C_{{\rm{unit}}}}. $ | (2) |
已知群体的收入和支出, 可以得到其效用函数, 计为UISP.
$ {U_{{\rm{ISP}}}} = {R_{{\rm{total}}}} - {C_{{\rm{total}}}} = {R_{\rm{u}}} + {R_{{\rm{cp}}}} - {C_0} + {C_{\rm{V}}} $ | (3) |
网络内容运营商的收入由广告费、平台服务费、金融业务等组成, 除此之外, 还与移动应用的商业模式相关, 例如游戏、电商、合作佣金等.第一部分收入往往有固定合约, 计为Rcp0, 后一部分收入取决于订阅内容的用户规模Suser与边际收益Mprofit, 计为Rcp1.
$ {R_{{\rm{total}}}} = {R_{{\rm{cp0 + }}}}{R_{{\rm{cp1}}}} = {R_{{\rm{cp0 + }}}}{S_{{\rm{user}}}} \bullet {M_{{\rm{profit}}}}. $ | (4) |
同理, ICP的成本也来自很多方面, 依然分为固定成本和可变成本两部分.CF代表公司内部用于日常运营的开销, CV代表付给ISPs的外部网络服务费.
$ {C_{{\rm{total}}}} = {C_{\rm{F}}} + {C_{\rm{V}}} = {C_{\rm{F}}} + \sum\limits_{y = 1}^m {\left( {N \bullet \bar B \bullet {P_y}} \right)} . $ | (5) |
已知ICP群体的收入和支出, 可以得到其效用函数, 计为UCP.
$ {U_{CP}} = {R_{{\rm{total}}}} - {C_{{\rm{total}}}} = {R_{{\rm{cp0 + }}}}{R_{{\rm{cp1}}}} - {C_{\rm{F}}} - {C_{\rm{V}}}. $ | (6) |
值得注意的是, 没有必要假设博弈过程中的每个变量都对参与者构成共同知识, 事实上, 这些利益相关者也不需要知道自己的支付状况, 此处的数值只用来定量比较动态博弈下的不同场景, 并预测行为偏好.
把ISP联盟在不同策略下的效用函数放入支付矩阵, 详细分析基于连接关系的合作行为如何为其带来益处.上文提到, ICP通过ISP把网络内容传递给用户, 这部分通信费用按移动应用的使用状况支付.另外, 规定单位价格是实时链路状态的函数.
ISP联盟中,竞争者的行动策略为“是否建立连接”,即是否选择合作.合作意味着博弈的双方维护并保证彼此间的链路畅通, 不合作意味着联盟中的一方独立为彼此间链路负责.这里遵循的原则是, 在一段网络链路的两端, 谁付出的建设成本更大, 谁在共同利润中获得的收益更高.无论联盟中双方如何选择策略, 假设在某个时间节点, 生态系统中的其他行为主体都不参与联盟内的竞争, 只观察市场的变化趋势, 并且思考未来的行动.为了把内容传递给特定的终端用户, ICP依然需要与其余的M-x个ISP建立连接, 使用其提供的网络接入服务.
为了形象地描绘演化过程相位图, 本文以种群中的2个ISP个体为例, 模拟动态博弈过程.
场景1 如果两者采取合作策略, ICP通过合作双方中任何一个获得的用户量,便可以达到之前的2倍,因此ICP会倾向于和其中之一合作, 向其付费并把两者看作一个联盟.联盟中的每个ISP可以对外宣布, 能够保障链路质量并且作为联盟存在.毋庸置疑, 网络服务费将会增加P(θ),这部分共同利益在内部按照α/(1-α)的比例分配.相应地,合作双方也需要按照β/(1-β)的比例均摊费用,这里的α和β呈正相关.
场景2 如果ISP1选择合作并保障链路质量,但ISP2拒绝合作,主动合作的ISP1需要独立承担所有的维护成本,却需要与ISP2共同分配利润,因为即便ISP2不发起合作,也会被动地为主动发起方贡献用户量.在这种情况下,每个ICP有2种策略到达所有的用户.显然,它会倾向于选择ISP1而节省NBP0单位的费用.另外,假设P(θ)<2P0,若ISP1不采取措施增加单位服务费,ISP2也不会改变其价格.ICP群体中的每一个应该支付2NBP0给联盟作为一个整体.当ISP1采取主动合策略,对外宣称其可以保证网络质量并提高收费标准,ICP会理性地选择和ISP1合作,一次性付款NBP(θ).为了使该问题有意义并保证商业合理性,NBP(θ)应该小于2NBP0并大于NBP0,P(θ)与链路状况θ正相关.显然,ICP会倾向于选择第二种组合来使利润最大化.
![]() |
表 1 ISP联盟的支付矩阵 Table 1 Payoff matrix of internet service provider(ISP)union |
场景3 如果ISP之间不合作,支付函数不改变.
2 演化稳定策略解决方案定义x为ISP种群选择合作策略的数量占总体的比例,这意味着联盟选择建立连接并保障链路质量,相应地,选择不合作策略的数量占ISP种群总体的比例为1-x.如果以种群中的2个ISP为例,模拟动态演化博弈过程,则x表示ISP1选择合作策略的概率,1-x表示不合作的概率.
当ISP1选择不合作,效用函数为
$ \begin{array}{l} {U_{1{\rm{w}}}} = y\left[{{R_{\rm{u}}} + \left( {1-\delta } \right)\sum\limits_{x = 1}^n {\left( {{N_x}\bar B\left( {P\left( \theta \right)-{P_0}} \right)} \right)-{C_0}} } \right] + \\ \left( {1 - y} \right)\left[{{R_{\rm{u}}} + \sum\limits_{x = 1}^n {\left( {{N_x}\bar B{P_0}} \right)}-{C_0}} \right] = \\ {R_{\rm{u}}} + \sum\limits_{x = 1}^n {\left( {{N_x}\bar B{P_0}} \right)} - {C_0} + \\ y\sum\limits_{x = 1}^n {\left\{ {{N_x}\bar B} \right.} \left. {\left[{\left( {1-\delta } \right)P\left( \theta \right) + \left( {\delta-2} \right){P_0}} \right]} \right\}. \end{array} $ | (8) |
因此,平均效用函数为
$ \begin{array}{l} \overline {{U_1}} = x{U_{{\rm{1r}}}} + \left( {1 - x} \right){U_{{\rm{1w}}}} = {R_{\rm{u}}} + \sum\limits_{x = 1}^n {\left( {{N_x}\bar B{P_0}} \right)} - {C_0} + \\ y\sum\limits_{x = 1}^n {\left\{ {{N_x}\bar B} \right.} \left. {\left[{\left( {1-\delta } \right)P\left( \theta \right) + \left( {\delta-2} \right){P_0}} \right]} \right\} + \\ x\left\{ {y\left\{ {\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\left( {\left( {\alpha-1} \right)P\left( \theta \right) + {P_0}} \right)} \right]} } \right.} \right. + \\ \left( {1 - \beta } \right)\theta \left. {{L_{\max }}{C_{{\rm{unit}}}}} \right\} + \sum\limits_{x = 1}^n {\left[{{N_x}\bar B\delta \left( {P\left( \theta \right)-{P_0}} \right)} \right]} - \\ \theta \left. {{L_{\max }}{C_{{\rm{unit}}}}} \right\}. \end{array} $ | (9) |
ISP1的复制动态方程可以从式(6)~(8) 中推导得到.群体选择进行建设投入策略的频率的相对调整速度和其支付超过平均支付的幅度成正比, 如果高于平均, 则增长率为正, 否则为负.
$ \begin{array}{l} \frac{{{\rm{d}}{x_1}}}{{{\rm{d}}t}} = x\left( {{U_{{\rm{1r}}}} - \overline {{U_1}} } \right)\\ \frac{{{\rm{d}}x}}{{{\rm{d}}t}} = x\left( {1 - x} \right)\left\{ {\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\delta \left( {P\left( \theta \right)-{P_0}} \right)} \right]} } \right. - \\ \theta {L_{\max }}{C_{{\rm{unit}}}} - y\left\{ {\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\left( {\left( {1-\alpha } \right)P\left( \theta \right) + {P_0}} \right)} \right]} } \right. - \\ \left( {1 - \beta } \right)\left. {\left. {\theta {L_{\max }}{C_{{\rm{unit}}}}} \right\}} \right\}. \end{array} $ | (10) |
类似地, 得到ISP2的复制动态方程:
$ \begin{array}{l} \frac{{{\rm{d}}y}}{{{\rm{d}}x}} = y\left( {{U_{{\rm{2w}}}} - \overline {{U_2}} } \right)\\ \frac{{{\rm{d}}y}}{{{\rm{d}}x}} = y\left( {1 - y} \right)\left\{ {\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\delta \left( {P\left( \theta \right)-{P_0}} \right)} \right]} } \right. - \\ \theta {L_{\max }}{C_{{\rm{unit}}}} - x\left\{ {\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\left( {\alpha P\left( \theta \right) + {P_0}} \right)} \right]} } \right. - \\ \beta \left. {\left. {\theta {L_{\max }}{C_{{\rm{unit}}}}} \right\}} \right\}. \end{array} $ | (11) |
一般地, 把以上组合叫做复制动态系统.
为了便于定量分析, 定义一些中间变量如下:
$ \begin{array}{l} {x_D} = \frac{{\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\delta \left( {P\left( \theta \right)-{P_0}} \right)} \right]} - \theta {L_{\max }}{C_{{\rm{unit}}}}}}{{\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\left( {\alpha P\left( \theta \right) + {P_0}} \right)} \right]} - \beta \theta {L_{\max }}{C_{{\rm{unit}}}}}} = \\ \frac{{{L_{\max }}\delta \left( {P\left( \theta \right) - {P_0}} \right) - \theta {C_{{\rm{total}}}}}}{{{L_{\max }}\left( {\alpha P\left( \theta \right) - {P_0}} \right) - \beta \theta {C_{{\rm{total}}}}}}. \end{array} $ | (12) |
$ \begin{array}{l} {y_D} = \frac{{\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\delta \left( {P\left( \theta \right)-{P_0}} \right)} \right]} - \theta {L_{\max }}{C_{{\rm{unit}}}}}}{{\sum\limits_{x = 1}^n {\left[{{N_x}\bar B\left( {\alpha P\left( \theta \right) + {P_0}} \right)} \right]} - \left( {1 - \beta } \right)\theta {L_{\max }}{C_{{\rm{unit}}}}}} = \\ \frac{{{L_{\max }}\delta \left( {P\left( \theta \right) - {P_0}} \right) - \theta {C_{{\rm{total}}}}}}{{{L_{\max }}\left( {\left( {1 - \alpha } \right)P\left( \theta \right) - {P_0}} \right) - \beta \theta {C_{{\rm{total}}}}}}. \end{array} $ | (13) |
定义uij为ISPj在场景i中的边际效益:
$ \left. \begin{array}{l} {u_{11}} = {L_{\max }}\left[{\alpha P\left( \theta \right)-{P_0}} \right] - \beta \theta {C_{{\rm{total}}}}, \\ {u_{12}} = {L_{\max }}\left[{\left( {1-\alpha } \right)P\left( \theta \right)-{P_0}} \right] - \left( {1 - \beta } \right)\theta {C_{{\rm{total}}}}, \\ {u_{21}} = {L_{\max }}\delta \left( {P\left( \theta \right) - {P_0}} \right) - \theta {C_{{\rm{total}}}}, \\ {u_{22}} = {L_{\max }}\left[{\left( {1-\delta } \right)\left( {P\left( \theta \right)-{P_0}} \right)-{P_0}} \right]. \end{array} \right\}. $ | (14) |
当ISP1和ISP2彼此间连接通畅, ICP会将其当作一个整体.一般地, 一个联盟整体的效用为LmaxP(θ)-θCtotal.如上文中假设, NBP(θ)应该介于NBP0和2NBP0之间, 该条件可表示为P(θ)∈[P0, 2P0].
可以观察到, 在前2种场景下, 联盟的边际收益相同, 可以表示为
$ {u_{11}} + {u_{12}} = {u_{21}} + {u_{22}} = {L_{\max }}\left[{P\left( \theta \right)-2{P_0}} \right] - \beta \theta {C_{{\rm{total}}}}. $ | (15) |
![]() |
表 2 ISP不合作与合作下的ICP支付情况 Table 2 Comparison of ICP's payment when ISPs choose to coorperate or not |
毫无疑问, 该效用函数(即联盟的边际效益)的数值必须不小于0.因此, 为了使演化博弈过程有意义, 假设u11和u12不能同时为负, 意味着两者联盟中至少有一者利润为负.
定理1 演化博弈均衡是一个策略组合, 该组合对应动态复制方程中的稳定点, 本系统的演化博弈稳态为(0, 0), (0, 1), (1, 0), (1, 1).当u11 < u12 < 0, u12 < u21或者0 < u21 < u11, u21 < u12时, (xD, yD)也是一个稳定状态.显然地, 对任意初始点(x(0), y(0))∈0, 1×0, 1, 有(x(f), y(f))∈0, 1×0, 1, 因此动态复制系统中的解曲线上任意一点(x, y)均对应着演化博弈的一个混合策略.
证明:根据推导出的复制动态方程, 令dx/dt=0, dy/dt=0, 明显地, 有4对坐标满足条件, 分别为(0, 0), (0, 1), (1, 0), (1, 1).如上文中定义的中间变量, xD=u21/u11, yD=u21/u21, 当u11 < u21 < 0, u12 < u21或者0 < u21 < u11, u21 < u12时, 上述条件等价于0 < xD < 1, 0 < yD < 1, 进而可以推导出dx/dt=0, dy/dt=0, 因此(xD, yD)也是一个合理的稳定状态.
复制动态系统的雅克比矩阵如下:
$ J = \left[\begin{array}{l} \frac{{\partial x'}}{{\partial x}}\;\;\frac{{\partial x'}}{{\partial y}}\\ \frac{{\partial y'}}{{\partial x}}\;\;\frac{{\partial y'}}{{\partial y}} \end{array} \right] = \left( \begin{array}{l} {a_{11}}\;\;{a_{12}}\\ {a_{21}}\;\;{a_{22}} \end{array} \right). $ | (16) |
$ \left. \begin{array}{l} {a_{11}} = \left( {1 - 2x} \right)\left\{ {{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right)} \right. - \theta {C_{{\rm{total}}}} - \\ y\left\{ {{B_{{\rm{cp}}}}\left[{\left( {1-\alpha } \right)P\left( \theta \right)-{P_0}} \right]} \right. - \left( {1 - \beta } \right)\left. {\left. {\theta {C_{{\rm{total}}}}} \right\}} \right\}, \\ {a_{12}} = - x\left( {1 - x} \right)\left\{ {{B_{{\rm{cp}}}}\left[{\left( {1-\alpha } \right)P\left( \theta \right)-{P_0}} \right]} \right. - \\ \left( {1 - \beta } \right)\left. {\theta {C_{{\rm{total}}}}} \right\}, \\ {a_{21}} = - y\left( {1 - y} \right)\left\{ {{B_{{\rm{cp}}}}\left[{\alpha P\left( \theta \right)-{P_0}} \right]} \right. - \beta \left. {\theta {C_{{\rm{total}}}}} \right\}, \\ {a_{22}} = \left( {1 - 2y} \right)\left\{ {{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right)} \right. - \theta {C_{{\rm{total}}}} - \\ x\left\{ {{B_{{\rm{cp}}}}\left[{\alpha P\left( \theta \right)-{P_0}} \right]} \right. - \left. {\left. {\beta \theta {C_{{\rm{total}}}}} \right\}} \right\}. \end{array} \right\} $ | (17) |
根据Friedman的理论[3], 通过动态复制方程得到的稳定点有可能不是系统的演化稳定策略(ESS), 除非以下条件被满足:
1) a11+a22 < 0 (迹条件,记为trJ)
2)
动态复制方程的均衡点是稳定的, 称为演化稳定策略.根据前文定义的网络模型, 雅克比矩阵的值和迹如下:
$ \begin{array}{l} \det J = {a_{11}}{a_{22}} - {a_{12}}{a_{21}} = \\ \left( {1 - 2x} \right)\left\{ {{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right)} \right. - \theta {C_{{\rm{total}}}} - \\ y\left\{ {{B_{{\rm{cp}}}}\left[{\left( {1-\alpha } \right)P\left( \theta \right)-{P_0}} \right]} \right. - \\ \left( {1 - \beta } \right)\left. {\left. {\theta {C_{{\rm{total}}}}} \right\}} \right\}\left( {1 - 2y} \right)\left\{ {{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right)} \right.\\ \theta {C_{{\rm{total}}}} - x\left\{ {{B_{{\rm{cp}}}}\left[{\alpha P\left( \theta \right)-{P_0}} \right]} \right. - \left. {\left. {\beta \theta {C_{{\rm{total}}}}} \right\}} \right\} - \\ x\left( {1 - x} \right){B_{{\rm{cp}}}}\left[{\left( {1-\alpha } \right)P\left( \theta \right)-{P_0}} \right] - \\ \left( {1 - \beta } \right)\left. {\theta {C_{{\rm{total}}}}} \right\}y\left( {1 - y} \right)\left\{ {{B_{{\rm{cp}}}}\left[{\alpha P\left( \theta \right)-{P_0}} \right]} \right. - \\ \left. {\beta \theta {C_{{\rm{total}}}}} \right\}. \end{array} $ | (18) |
$ \begin{array}{l} {\rm{tr}}J = {a_{11}} + {a_{22}} = \\ \left( {1 - 2x} \right)\left\{ {{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right)} \right. - \theta {C_{{\rm{total}}}} - \\ y\left\{ {{B_{{\rm{cp}}}}\left[{\left( {1-\alpha } \right)P\left( \theta \right)-{P_0}} \right]} \right. - \left( {1 - \beta } \right)\left. {\left. {\theta {C_{{\rm{total}}}}} \right\}} \right\} + \\ \left( {1 - 2y} \right)\left\{ {{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right)} \right.\theta {C_{{\rm{total}}}} - \\ x\left\{ {{B_{{\rm{cp}}}}\left[{\alpha P\left( \theta \right)-{P_0}} \right]} \right. - \left. {\left. {\beta \theta {C_{{\rm{total}}}}} \right\}} \right\}. \end{array} $ | (19) |
定理2 根据前面介绍的方法, 可以把稳定点的坐标值代入detJ和trJ, 计算其正负, 进一步判断哪些点是演化稳定状态.
当u11为正, u12为负时,
1) 如0 < u21 < u11, 0 < xD < 1, yD < 0, ESS为(1, 0);
2) 如u21 > u11, xD > 1, yD < 0, ESS为(1, 1);
3) 如u12 < u21 < 0, xD < 0, 0 < yD < 1, ESS为(0, 0);
4) 如u21 < u12, xD < 0, yD > 1, ESS为(0, 0).
当u11为负, u12为正时,
1) 如0 < u21 < u12, xD < 0, 0 < yD < 1, ESS为(0, 1);
2) 如u21 > u12, xD < 0, yD > 1, ESS为(1, 1);
3) 如u11 < u21 < 0, 0 < xD < 1, yD < 0, ESS为(0, 0);
4) 如u21 < u11, xD > 1, yD < 0, ESS为(0, 0)
当u11和u12都为负时,
1) 如u21 > 0, xD < 0, yD < 0, ESS为(1, 1);
2) 如u11 < u21 < 0, u12 < u21, 0 < xD < 1, 0 < yD < 1, ESS为(0, 0), (1, 1);
3) 如u11 < u21 < u12, 0 < xD < 1, yD > 1, ESS为(0, 0);
4) 如u12 < u21 < u11, xD > 1, 0 < yD < 1, ESS为(0, 0);
5) 如u21 < u11, u21 < u12, xD > 1, yD > 1, ESS为(0, 0).
![]() |
图 3 动态演化相位图 1 Fig. 3 Diagram of phase dynamic evolution Ⅰ |
![]() |
图 4 动态演化相位图 2 Fig. 4 Diagram of phase dynamic evolution Ⅱ |
![]() |
图 5 动态演化相位图 3 Fig. 5 Diagram of phase dynamic evolution phase Ⅲ |
![]() |
表 3 ESS演化示例1 Table 3 Example of ESS evolution 1 |
![]() |
表 4 ESS演化示例2 Table 4 Example of ESS evolution 2 |
根据上文稳定状态的变化, 可以得出不同场景下ISP个体之间如何演化博弈进而影响群体行为.
3.1 联盟中的双方有盈有亏如果一方主动合作一方搭便车, 主动合作方亏损, 那么, 由于总收益固定, 和主动合作方相比, 搭便车的一方一定更占优势, 最终(0, 0) 是ESS点.
如果一方主动合作一方搭便车, 主动合作方的盈利超过共同合作的最大盈利, 主动方一定选择合作, 由于总收益固定, 为了不亏损更多, 另一方倾向于选择合作, 最终, (1, 1) 是ESS点.
如果一方主动合作一方搭便车, 主动合作方盈利, 但少于共同合作的最大盈利, 主动合作方倾向于协作, 但另一方搭便车亏损更少, 最终(1, 0)/(0, 1) 是ESS点.
3.2 联盟中的双方均亏损如果一方主动合作一方搭便车, 主动合作方盈利, 由于总收益固定, 另一方选择搭便车亏损更多, 最终, (1, 1) 是ESS点.
如果一方主动合作一方搭便车, 主动合作方比双方合作时亏损更多, 合作没有意义, 最终(0, 0) 是ESS.
如果一方主动合作一方搭便车, 主动合作方确定可以亏损更少, 那么由于总收益固定, 另一方搭便车确定亏损更多, 双方有可能达成协作也有可能选择不合作.
![]() |
表 5 ESS演化示例3 Table 5 Example of ESS evolution 3 |
如图 6所示, 演化博弈OADC(面积S1)可以收敛到点O, 最终选择不合作来到达稳定状态.演化博弈ADCB(面积S2)可以收敛到点B, 最终选择合作来达到稳态.尽管合作是帕累托最优结果, 但2个ISP选择相同的策略都能达到演化稳定状态.本节分析结果的概率及影响因素.
$ \begin{array}{l} {S_1} = {S_{{\rm{OADC}}}} = {S_{{\rm{OAD}}}} + {S_{{\rm{OCD}}}} = \frac{1}{2}\left( {{x_D} + {y_D}} \right) = \\ \frac{1}{2}\left( {\frac{{{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right) - \theta {C_{{\rm{total}}}}}}{{{B_{{\rm{cp}}}}\left( {\alpha P\left( \theta \right) - {P_0}} \right) - \beta \theta {C_{{\rm{total}}}}}} + } \right.\\ \left. {\frac{{{B_{{\rm{cp}}}}\delta \left( {P\left( \theta \right) - {P_0}} \right) - \theta {C_{{\rm{total}}}}}}{{{B_{{\rm{cp}}}}\left( {\left( {1 - \alpha } \right)P\left( \theta \right) - {P_0}} \right) - \left( {1 - \beta } \right)\theta {C_{{\rm{total}}}}}}} \right). \end{array} $ | (20) |
![]() |
图 6 动态演化相位图 4 Fig. 6 Diagram of phase dynamic evolution phase Ⅳ |
定义T为投入产出比:
$ T = \frac{{{C_{{\rm{total}}}}}}{{{B_{{\rm{cp}}}}{P_0}}} = \frac{{{L_{\max }}{C_{{\rm{unit}}}}}}{{\sum\limits_{x = 1}^n {{N_x}\bar B{P_0}} }} $ | (21) |
如上文假设, P(θ)=-P0eθ+2P0, 当动态复制系统达到稳态时, 可以得到趋势的概率:
$ \begin{array}{l} {S_1} = \frac{1}{2}\left( {\frac{{\delta \left( {1 - {{\rm{e}}^{ - \theta }}} \right) - \theta T}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + 1 - \beta \theta T}}} \right. + \\ \left. {\frac{{\delta \left( {1 - {{\rm{e}}^{ - \theta }}} \right) - \theta T}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + {{\rm{e}}^{ - \theta }} - 1 + 1 - \beta \theta T}}} \right). \end{array} $ | (22) |
定理3 投入产出比T小于固定值R时的情况.
当一方主动合作、一方搭便车, 主动一方边际收益小于0时, 双方合作下的一方获得收益越多, 另一方获得收益越少, ESS趋向(1, 1) 的概率越大.即如果成本控制在一定比例之内, 合作的双方得知, 选择协作自己的收益有可能大于0, 为了增加自身收益, 都会更加倾向于投入建设, 保障链路质量.
当一方主动合作、一方搭便车, 主动一方边际收益大于0时, 双方合作下的一方获得收益越多, 另一方获得收益越少, ESS趋向(0, 0) 的概率越大.即如果成本控制在一定比例之内, 为了维持自身的收益不流向竞争对手, 双方都会更倾向于不投入建设, 保障链路质量.
证明:
$ \begin{array}{l} {S_1} = \frac{1}{2}\left( {\frac{{ - \left( {2 - {{\rm{e}}^{ - \theta }}} \right)\left[{\delta \left( {1-{{\rm{e}}^{-\theta }}} \right)} \right] - \theta T}}{{{{\left[{\alpha \left( {2-{{\rm{e}}^{-\theta }}} \right) + 1-\beta \theta T} \right]}^2}}}} \right. + \\ \left. {\frac{{\left( {2 - {{\rm{e}}^{ - \theta }}} \right)\left[{\delta \left( {1-{{\rm{e}}^{-\theta }}} \right)} \right] - \theta T}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + {{\rm{e}}^{ - \theta }} - 1 + \left( {1 - \beta } \right)\theta {T^2}}}} \right).\\ \theta > 0, 0 < - {{\rm{e}}^{ - \theta }} < 1, {u_{21}} = \left[{\delta (1-{{\rm{e}}^{-\theta }})-\theta T} \right]{B_{{\rm{cp}}}}. \end{array} $ |
令
$ \begin{array}{l} \Delta = \left( { - \beta \theta T + 1} \right) - \left( {{{\rm{e}}^{ - \theta }} - \beta \theta T + \theta T - 1} \right) = \\ 2 - {{\rm{e}}^{ - \theta }} - \theta T > 0 \end{array} $ |
得到
$ T < \frac{{2 - {{\rm{e}}^{ - \theta }}}}{\theta }. $ |
令
$ y = \frac{{2 - {{\rm{e}}^{ - \theta }}}}{\theta }, y\prime = \frac{{{{\rm{e}}^{ - \theta }}\theta - \left( {2 - \theta } \right)}}{{{\theta ^2}}}, $ |
存在θ0使得θ > θ0, y′>0;θ < θ0, y′ < 0, 因此y在θ0处取极小值.
令T0=y|θ0, 并且当T < T0, Δ > 0时:当u21 < 0,
定理4 投入产出比T小于固定值R时:
当一方主动合作、一方搭便车, 主动一方边际收益小于0时, 双方合作下的一方付出成本越多, 另一方付出成本越少, 双方趋向(0, 0) 的概率越大.
即如果成本控制在一定比例之内, 即便付出成本也不能得到收益, 双方都会更倾向于不投入建设.
当一方主动合作、一方搭便车, 主动一方边际收益大于0时, 双方合作下的一方付出成本越多, 另一方付出成本越少, 双方趋向(1, 1) 的概率越大.
即如果成本控制在一定比例之内, 合作双方得知, 自己付出成本越多, 得到收益可能越多, 为增加自身收益, 都会更加倾向于投入建设, 保障链路质量.
证明:
$ \begin{array}{l} {S_1} = \frac{1}{2}\left[{\frac{{\delta \left( {1-{{\rm{e}}^{-\theta }}} \right)-\theta T}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + 1 - \beta \theta T}}} \right. + \\ \left. {\frac{{\delta \left( {1 - {{\rm{e}}^{ - \theta }}} \right) - \theta T}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + {{\rm{e}}^{ - \theta }} - 1 + \left( {1 - \beta } \right)\theta T}}} \right], \\ \frac{{\partial {S_1}}}{{\partial \beta }} = \frac{1}{2}\left\{ {\frac{{\theta T\left[{\delta \left( {1-{e^{-\theta }}} \right)-\theta T} \right]}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + 1 - \beta \theta {T^2}}}} \right. + \\ \left. {\frac{{\theta T\left[{\delta \left( {1-{e^{-\theta }}} \right)-\theta T} \right]}}{{\left[{\alpha \left( {2-{{\rm{e}}^{-\theta }}} \right) + {e^{-\theta }} - 1 + \left( {1 - \beta } \right)\theta {T^2}} \right]}}} \right\}. \end{array} $ |
当u21 < 0,
定理5 投入产出比T小于固定值R时:
当一方主动合作、一方搭便车, 主动一方获益越多, 搭便车一方获益越少, 双方趋向(1, 1) 的概率越大.即如果成本控制在一定比例之内, 主动合作的一方得知, 如果合作自己的收益有可能大于0, 为了增加自身收益, 都会更加倾向于投入建设, 保障链路质量.
当一方主动合作、一方搭便车, 主动一方获益越多, 搭便车一方获益越少, 双方趋向(1, 1) 的概率越大.即如果成本控制在一定比例之内, 主动合作的一方得知, 如果合作自己的收益有可能大于0, 为了增加自身收益, 都会更加倾向于投入建设, 保障链路质量.
证明:
$ \begin{array}{l} {S_1} = \frac{1}{2}\left[{\frac{{\delta \left( {1-{{\rm{e}}^{-\theta }}} \right)-\theta T}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + 1 - \beta \theta T}}} \right. + \\ \left. {\frac{{\delta \left( {1 - {{\rm{e}}^{ - \theta }}} \right) - \theta T}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + {{\rm{e}}^{ - \theta }} - 1 + \left( {1 - \beta } \right)\theta T}}} \right], \\ \frac{{\partial {S_1}}}{{\partial \beta }} = \frac{1}{2}\left[{\frac{{1-{e^{-\theta }}}}{{\alpha \left( {2-{{\rm{e}}^{ - \theta }}} \right) + 1 - \beta \theta T}} + } \right.\\ \left. {\frac{{1 - {e^{ - \theta }}}}{{\alpha \left( {2 - {{\rm{e}}^{ - \theta }}} \right) + {e^{ - \theta }} - 1 + \left( {1 - \beta } \right)\theta T}}} \right]. \end{array} $ |
其中, θ > 0, 1 < 1-e-θ < 2.令
$ \begin{array}{l} \Delta = \left[{\alpha \left( {2-{{\rm{e}}^{-\theta }}} \right)-\beta \theta T + 1} \right] - \\ \left[{\alpha \left( {2-{{\rm{e}}^{-\theta }}} \right) + {{\rm{e}}^{-\theta }} - \beta \theta T + \theta T - 1} \right] = \\ 2 - {{\rm{e}}^{ - \theta }} - \theta T > 0, 得到\\ T < \frac{{2 - {{\rm{e}}^{ - \theta }}}}{\theta }, {\rm{let}}\;\;y{\rm{ = }}\frac{{2 - {{\rm{e}}^{ - \theta }}}}{\theta }, y' = \frac{{{{\rm{e}}^{ - \theta }}\theta - \left( {2 - \theta } \right)}}{{{\theta ^2}}}, \end{array} $ |
存在θ0使得θ > θ0, y′ > 0;θ < θ0, y′ < 0, y在θ0取极小值.令T0=y|θ0, 有T < T0, Δ > 0,
从上述结论可以得到(合作, 合作)和(不合作, 不合作)这2个策略组合均是稳定的.为了研究演化结果向哪个方向发展, 影响因素如何, 运用Matlab对系统进行数值模拟, 进一步分析不同合作场景下的收益分配机制、链路状况系数、投入产出比对于网络服务提供商和内容提供商合作的影响.如图 7所示, 博弈双方演化结果的趋势由区域1、区域2的面积大小决定, 有5个参数影响S1/S2的大小, 分别是双方主动合作场景下的收益分,配系数α和成本分担系数β, 一方主动合作场景下的收益分配系数δ, 链路状况系数θ, 投入产出比T.其中,
$ T = \frac{{{L_{{\rm{max}}}}{C_{{\rm{unit}}}}}}{{\sum\limits_{x = 1}^n {\left( {{N_x}\bar B{P_0}} \right)} }}. $ |
![]() |
图 7 不同成本分配比例对合作概率的影响 Fig. 7 Influence of cost allocation on coorperation under different α values |
根据现实情况和模型的假设条件:设合作场景下网络内容提供商的应用数量取值N∈[1.0×106, 2.0×106], 每个应用的平均占用带宽B∈[2.0×107, 3.0×107], 初始连接状态下, ICP的每兆流量定价P0∈[1, 2]元, 2个ISP间维护链路畅通所需要付出的总成本为[1.0×107, 2.0×107]元.同时, 当双方均投入建设时, 向其中一方付费的ICP数量占总体的比率α∈[0.1, 0.9], 一方维护建设的投入成本占总成本的比率β∈[0.1, 0.9], 根据前提假设, 投入成本越大, 其分得利益也就越大.假设一方投入建设而另一方不投入时, 向投入方付费的CP数量占总体比率δ∈[0.1, 0.9], 而链路状况系数θ∈[0.1, 0.9].
在对各因素进行具体的分析时, 需要给定相关参数的数值:ICP提供的应用个数N=1.5×106, 每个应用的平均带宽B=2.5×107M, 对于ICP的流量定价P0=1.5元, 2个ISP间维护链路畅通所需要付出的总成本为1.5×107元, 所以投入产出比T=0.27.同时, 双方均投入建设时, 向其中一方付费的ICP数量占总体的比率α=0.4, 投入成本所占比重β=0.4, 一方投入建设而另一方不投入时, 向投入方付费的CP数量占总体比率δ=0.6, 链路状况系数θ=0.5.
4.1 双方合作状态下的成本与收益本节讨论双方合作状态下收益分配和成本分摊比例对合作的影响.设收益分配系数α在[0.1, 0.9]变化, 成本分担系数β在[0.1, 0.9]中变化, 可以得到成本收益对合作概率的影响.
当α分别取0.4, 0.6, 0.8时, β在[0.1, 0.9]变化, 得到面积S1与β的关系如图 7所示.在有效区域内, u21 < 0, S1随着β的增加而增加, 说明主动合作方付出成本越多, 双方趋向(0, 0) 的概率越大, 与定理4一致.
当β分别取0.4, 0.6, 0.8时, α在[0.1, 0.9]变化, 得到面积S1与α的关系如图 8所示.在有效区域内, u21 < 0, S1随着α的增加而减小, 说明主动合作方付出成本越多, 双方趋向(1, 1) 的概率越大, 与定理3一致.
![]() |
图 8 不同收益分配比例对合作概率的影响 Fig. 8 Influence of profit allocation on coorperation under different β values |
本节讨论一方合作而另一方不合作状态下,收益分配比例对合作的影响.假设双方合作时, 收益分配和成本分摊比率均为0.4, 当一方不参与合作时, 成本由主动合作方支付, 当收益分配系数δ在区间[0.1, 0.9]变化时, 得到双方合作的概率, 如图 9所示.S1随δ的增加而增加, 主动合作方获益越多, 搭便车一方获益越少, 双方趋向(1, 1) 的概率越大.
![]() |
图 9 收益分配对合作概率的影响 Fig. 9 Influence of profit allocation on coorperation |
假设双方合作时, 收益分配比率α和成本分摊比率β均为0.5, 当一方不参与合作时, 成本由主动合作方支付, 收益分配系数δ=0.9, 当链路状况系数θ在[0.1, 0.9]变化时, 得到双方合作的概率, 如图 10所示.在2种合作场景下, 链路状况越好, 双方趋向(1, 1) 的概率越大.
![]() |
图 10 链路状况对合作概率的影响 Fig. 10 Influence of link state on coorperation |
(1) 当联盟中一方的经济效用由于其复杂的心理作用和利益偏好而产生盈亏时, ESS的概率发生明显波动.网络服务提供商群体在某个时刻达到ESS, 将呈现偏好趋同的小团体局部稳定的分布状态.
(2) 当投入产出比在一定范围内, ESS的概率会随主动合作一方边际收益的属性和成本收入的分配比率而发生线性变化.因此, 成本控制和利润分配机制是形成合作的关键, 宏观调控将改变运营商的选择.
(3) 通过采取激励或惩罚措施, 政府及监管机构可以推动运营商之间的合作, 不仅有利于公共资源的有效合理配置, 更重要是, 督促和引导通信市场的各个主体把资金和资源投入到科技创新与内容服务中.
[1] | FRIEDMAN D. On economic applications of evolutionary game theory[J]. Journal of Evolutionary Economics, 1998, 8(1): 15–43. DOI:10.1007/s001910050054 |
[2] | FRIEDMAN D. Towards evolutionary game models of financial markets[J]. Quantitative Finance, 2001, 1(1): 177–185. DOI:10.1080/713665544 |
[3] | HOFBAUER J, SIGMUND K. Evolutionary gamedynamics[J]. Bulletin of the American MathematicalSociety, 2003, 40(4): 479–519. DOI:10.1090/S0273-0979-03-00988-1 |
[4] | FARATIN P, CLARK D, BAUER S, et al. Complexity of Internet interconnections: technology, incentives and implications for policy[J/OL]. The 35th Research Conference on Communication, Information and Internet Policy (TPRC), 2007. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2115242. |
[5] | MA R, CHIU D, LUI J, et al. On cooperative settlement between content, transit, and eyeball internet service providers[J]. IEEE/ACM Transactions on networking, 2011, 19(3): 802–815. DOI:10.1109/TNET.2010.2089533 |
[6] | BAILEY J P. The economics of Internet interconnection agreements[J]. Internet Economics, 1997, 35: 155–168. |
[7] | HUSTON G. ISP survival guide: strategies for running a competitive ISP[M]. New Jersey: John Wiley & Sons, Inc, 1998. |
[8] | SHAKKOTTAI S, SRIKANT R. Economics of network pricing with multiple ISPs[J]. IEEE/ACM Transactions On Networking, 2006, 14(6): 1233–1245. DOI:10.1109/TNET.2006.886393 |
[9] | MA R T B, LEE S, LUI J, et al. Incentive and service differentiation in P2P networks: a game theoretic approach[J]. IEEE/ACM Transactions on Networking (TON), 2006, 14(5): 978–991. DOI:10.1109/TNET.2006.882904 |
[10] | SU H, XU K, SHEN M, et al. Research on mobile data subsidy model and case study[J]. Journal of Computer Research and Development, 2016, 53(4): 861–872. |
[11] | XU K, ZHONG Y, HE H. Can P2P technology benefit eyeball ISPs? A cooperative profit distribution answer[J]. IEEE Transactions on Parallel and Distributed Systems, 2014, 25(11): 2783–2793. DOI:10.1109/TPDS.2013.267 |
[12] | 张春燕, 徐恪, 王保进, 等. 多接口移动主机最优化费用和性能方法研究[J]. 计算机学报, 2011, 34(11): 2173–2186. |
[13] | MACKIE-MASON J K, VARIAN H R. Pricing the Internet, Public access to the Internet[J]. Prentice-Hall, 1995, pp: 269–314. |
[14] | SEMRET N, LIAO R R F, CAMPBELL A T, et al. Pricing, provisioning and peering: dynamic markets for implications for network interconnections[J]. IEEE journal on selected areas in communications, 2000, 18(12): 2499–2513. DOI:10.1109/49.898733 |
[15] | FRIEDMAN D. Evolutionary economics goes mainstream: a review of the theory of learning in games[J]. Journal of Evolutionary Economics, 1998, 8(4): 423–432. DOI:10.1007/s001910050071 |