Game Theory 01
1. 一场博弈的四个基本要素
- 至少两个参与者。博弈论的参与者又被称为决策主体,也就是在博弈中制定决策的人
- 利益
- 策略。在博弈中,决策主体根据获得的信息和自己的判断,制定出一个行动方案,这个行动方案便是策略
- 信息。利益是博弈的目的,策略是获得利益的手段,而信息就是制定策略的依据
2. 博弈的分类
2.1 合作博弈和非合作博弈
根据博弈的参与者之间是否有一个具有约束力的协议,博弈可分为合作博弈和非合作博弈
- 合作博弈。合作博弈并不是指参与者之间有合作的意向,或是合作态度,而是参与者之间有具有约束力的协议、约定或者契约,参与者必须在这些协议的范围内进行博弈。合作博弈是研究合作中如何分配利益的问题,目的是使得协议框架内所有参与者都满意。
- 非合作博弈。非合作博弈指参与者在博弈的时候,无法达成一个对各方都有约束力的协议。非合作博弈的目的是如何为自己争取最大化的利益,并不考虑其他参与者的利益。
2.2 静态博弈与动态博弈
按照参与者选择策略、作出决定的先后顺序,可分为静态博弈与动态博弈
- 静态博弈。如果参与者们同时选择策略,或者虽然有先后,但是后做出策略的参与者并不知道其他参与者的策略,那就是静态博弈,例如”剪刀石头布”
- 动态博弈。如果参与者的行动有先后顺序,并且后者是在了解前者策略的前提下制定自己的策略,这种情况就是动态博弈,如打扑克
2.3 完全信息博弈和不完全信息博弈
基于对其他参与者的信息掌握程度,可分为完全信息博弈和不完全信息博弈
- 完全信息博弈是指博弈中对其他参与者特征、利益、可能选择的策略等信息都有一个准确的了解
- 不完全信息博弈是指博弈中对其他参与者特征、利益、可能选择的策略等信息没有一个准确的了解,或者有多个参与者的情况下,只有对个别参与者的信息了解
2.4 负和博弈、零和博弈与正和博弈
按照博弈的结果来分,博弈分为负和博弈、零和博弈与正和博弈
- 负和博弈。负和博弈指博弈的参与者最后得到的收获都小于付出,都没有占到便宜,是一种两败俱伤的博弈
- 零和博弈。零和博弈是指参与者中一方获益,另一方损失,并且参与者之间获得的利益与损失之和为零,如赌博
- 正和博弈。正和博弈又被称为双赢博弈、合作博弈,是指参与者都能获益,或者一方的收益增加并不影响其他参与者的利益,这种博弈被认为是结局最好的一种博弈,也就是双赢
3. 纳什均衡
Wiki
简单来说就是,多人参加的博弈中,每个人根据他人的策略制定自己的最优策略,所有人的这些策略组合成一个策略组合,在这个策略组合里,没有人会主动改变自己的策略,那样会降低他的收益,只要没有人做出策略调整,任何一个理性的参与者都不会主动改变自己的策略,这个时候,所有参与者的策略并达到了一种平衡,这种平衡就是”纳什均衡”
严谨的”纳什均衡”定义为:
在博弈\(G=\{S_1,\cdots,\cdots,S_n: u_1,\cdots,\cdots,u_n\}\)中,如果由各个博弈方的各一个策略组成的某个策略组合\(s_1^{*},\ldots,\ldots,s_n^{*}\)中,任一博弈方的策论\(s_i^{*}\)都是对其余博弈方策略的组合\(s_1^{*},\ldots,s_{i-1}^{*},s_{i+1}^{*},\ldots,s_n^{*}\)的最佳对策,也即\(
u_i(s_1^{*},\ldots,s_{i-1}^{*},s_i^{*},s_{i+1}^{*},\ldots,s_n^{*}) \geq
u_i(s_1^{*},\ldots,s_{i-1}^{*},s_{ij}^{*},s_{i+1}^{*},\ldots,s_n^{*})
\)对任意\(s_{ij}\in S_i\)都成立,则称\(s_1^{*},\ldots,\ldots,s_n^{*}\)为G的一个“纳什均衡”
4. 夏普里值方法
夏普里值方法以每个局中人对联盟边际贡献大小来分配联盟的总收益,它的目标是构造一种综合考虑冲突各方要求的折中的效用分配方案,从而保证分配的公平性
用夏普里值方法解决合作利益分配问题时,需要满足以下两个条件:
- 局中人之间地位平等
- 所有局中人得到的利益之和是联盟的总财富