数学建模博弈理论与实践国防科大版

目录

4.博弈模型

4.1.Nash平衡点和帕雷托最优

4.2.囚徒困境

4.3.智猪博弈

4.4.脏脸之谜

5.军事问题数学建模

5.1.兰彻斯特作战模型

5.1.1.一般战斗模型

5.1.2游击战模型

5.1.3.混合战模型

5.2.硫磺岛战役


4.博弈模型

本讲介绍博弈模型,包括博弈论(Game theory,又称对策论)中最基本的一些概念,以及非合作博弈论中的纳什平衡和帕雷托最优概念,同时介绍博弈论中的几个著名案例:囚徒困境、智猪博弈、脏脸之谜等。

1705677332424

博弈有5个基本要素:

  1. 局中人(选手)参与博弈的个人或团体。

  2. 策略(对策)可供局中人选择的行动方案。

  3. 赢利(获益)局中人的收益或支付。

  4. 信息 在策略选择中,信息是最关键的因素。

  5. 均衡 博弈的最终结果。

n人博弈模型的几个符号约定:

选手集:N={1, 2, …, n}

策略集:S1, S2, ..., Sn

决策集:D∈S=S1xS2x···x Sn

赢利函数:f1,f2, ..., fn D→R

例如:田忌赛马

S齐=S田={(上中下), {中下上}, {下上中}, {上下中}, {中上下}, {下中上}}

f齐{(上中下), (下上中)} = 0

f田{(上中下), (下上中)} = 1

下面讨论合作与不合作两种情形下的博弈

如果选手k知道了其他选手的策略xi,(i=1,2,…,n,i≠k),自然希望取策略 xk∈Sk

4.1.Nash平衡点和帕雷托最优

定义选手k的合理反应集为

Rk={(x1,.., xn)∈D|(x1, ..., xn)使得(*)成立}

各选手都希望好、决策在各自的合理反应集中,所以称(x1, ..., xn)∈R1∩···∩Rn

为n人非合作对策的一个纳什平衡点。

对于Nash平衡点,在别人不改变对策的情况下,每个选手的对策都是最好的,故他们都不会轻易去改变自己的对策。所以,非合作博弈的解将在Nash平衡点处出现。

Nash定理 非零和非合作博弈的Nash平衡点一定存在

问题 Nash平衡点对博弈各方是否一定是最优的?

再考虑合作情形。

记f=(f1,f2, ..., fn)

定义:Dn={x∈D|f(x)≥f(x0)} x0是纳什平衡点

Dn称为合理集,最终的合作决策必定出自合理集中。

决策x∈D称为帕雷托(Pareto)最优的是指:D中不存在决策y使得f(y)>f(x)

4.2.囚徒困境

囚徒困境——非零和博弈

设两偷盗犯因被发现藏有被盗物品而被拘留。现被分别单独关押。两人都知道,如果都不承认偷盗,将以窝赃罪各判1年监禁;如果都承认,将以偷盗罪各判5年。但如果一人招认而另一人不承认,则坦白者将从宽处理获得释放,而抗拒者从严被判10年。这两个囚犯该如何选择自己的最优策略?

两个囚犯的策略集都是{x(招认), y(不招认)}

盈利函数分别为:

f1(x,x) = -5

f1(x,y) = 0

f1(y,x) = -10

f1(y,y) = -1

f2(x,x) = -5

f2(x,y) = -10

f2(y,x) = 0

f2(y,y) = -1

各自的合理反应集为:

R1 = {(x,x), (x, y)}

R2 = {(x,x),(y,x)}

4.3.智猪博弈

智猪博弈一弱势方的抉择

猪圈里有一头大猪,一头小猪。猪圈的一头有一个食槽,另一头有一个控制猪食供应的按钮按一次按钮,有10个单位的猪食入槽,但是按按钮要付出两个单位的跑动成本。若大猪先到食槽则大猪吃到9个单位猪食,小猪吃到1个单位;若两猪同时到达食槽,大猪吃7个单位猪食,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。

1705844162321

大猪按钮,小猪不动

4.4.脏脸之谜

脏脸之谜一共同知识

三姐妹从外面回到家里,她们的脸都是脏的,但她们自己并不知道。母亲见到她们后说道:“你们三人中至少有一个人的脸是脏的”,她们没有反应,因为这是一个显然的事实,她们认为母亲说的是一句“废话”。但当母亲追问一句“你们知道是谁吗?”她们先是互相看了一下,然后都脸红了,都知道自己的脸是脏的,这是为什么?

共同知识一每个人都知道这个事实,每个人都知道每个人都知道这个事实,每个人都知道每个人都知道每个人都知道这个事实,…

5.军事问题数学建模

5.1.兰彻斯特作战模型

第一次世界大战时提出的预测战争结局的模型

只考虑双方兵力多少和战斗力强弱。

兵力:

  1. 因战斗减员而减少

  2. 因非战斗减员而减少

  3. 因增援而增加

战斗力:

  1. 与射击率(单位时间的射击次数)、射击命中率以及战争的类型(常规战、游击战)等有关。

5.1.1.一般战斗模型

假设:

  1. 每一方的战斗减员率取决于双方的兵力和战斗力,用f(x,y)和g(x,y)表示。

  2. 每一方的增员率是给定的函数,用u(t)和v(t)表示。

模型如下:

1705935620080

-f(x,y) 单位时间内因为战斗减员而减少的兵力数

-ax 单位时间内因非战斗减员而减少的兵力数量

u(t) 单位时间内因增援而增加的兵力数量

dx/dt 单位时间内增加或减少的兵力数量

-g(x,y) 则是乙方的

1705974277732

将非战斗减员与增员归于初值中,则模型进一步简化为:

常规战模型相轨线

1705975570178

这就是平方律模型

5.1.2游击战模型

甲乙双方都用游击部队作战。

甲方士兵在乙方士兵看不到的某个面积为S的隐蔽区域内活动,乙方士兵不是向甲方士兵开火,而是向这个隐蔽区域射击,并且不知道杀伤情况。这时甲方战斗减员率不仅与乙方兵力有关,而且随着甲方兵力的增加而增加。

f可简单假设为:

f = ay = (cx)y = cxy

乙方的战斗有效系数

1705976263130

1705976271820

5.1.3.混合战模型

1705976441547

1705976479581

5.2.硫磺岛战役

思考题

1705977985018

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2869905.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

C/C++整数和浮点数在内存中存储

1. 整数在内存中的存储: 整数的2进制表⽰⽅法有三种,即 原码、反码和补码 三种表⽰⽅法均有符号位和数值位两部分,符号位都是⽤0表⽰“正”,⽤1表⽰“负”,⽽数值位最 ⾼位的⼀位是被当做符号位,剩余的都是…

Redis远程连接本机——Docker

1. Docker拉取redis镜像并创建容器 1.1 拉取redis镜像 如果要指定redis版本,需要使用redis:(版本),不写默认最新版本 docker pull redis1.2 创建容器并挂载配置文件 创建一个redis目录,并在其创建一个conf目录和一个d…

Rocky Linux 基本工具的安装

1.系统安装后先查看ip地址 ip addr 2.安装net工具 :ifconfig yum install net-tools 3.安装gcc ;选择都选 y yum install gcc yum install gcc-c 4.安装tcl yum install -y tcl 5.安装lsof (端口查看工具) yum install l…

深度强化学习(七)策略梯度

深度强化学习(七)策略梯度 策略学习的目的是通过求解一个优化问题,学出最优策略函数或它的近似函数(比如策略网络) 一.策略网络 假设动作空间是离散的,,比如 A { 左 , 右 , 上 } \cal A\{左,右,上\} A{左,右,上},策…

用SeaTunnel从SQL Server向Elasticsearch同步数据

文章目录 引言I 步骤1.1 环境准备1.2 配置JDBC插件1.3 编写SeaTunnel任务配置II Enable Sql Server CDC引言 SeaTunnel 的官网 https://seatunnel.apache.org/ Support SQL Server Version: server:2008 (Or later version for information only)Supported DataSource Info: …

布隆过滤器原理及应用场景

目录 一、布隆过滤器概述1.1 什么是布隆过滤器1.2 优缺点 二、布隆过滤器原理2.1 布隆过滤器的组成2.2 元素添加和查询 三、 应用场景参考资料 一、布隆过滤器概述 1.1 什么是布隆过滤器 布隆过滤器(Bloom Filter)是一种数据结构,用于快速检…

[蓝桥杯练习题]Fizz Buzz经典问题

return的艺术 #include<bits/stdc.h> using namespace std; int main(){ios::sync_with_stdio(0);cin.tie(nullptr);cout.tie(nullptr);int n;cin>>n;if(n%50&&n%30)return !(cout<<"FizzBuzz");if(n%30)return !(cout<<"Fizz&…

Microsoft Word 符号 / 特殊符号

Microsoft Word 符号 / 特殊符号 1. 插入 -> 符号 -> 其他符号 -> Wingdings 2References 1. 插入 -> 符号 -> 其他符号 -> Wingdings 2 ​ References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/

PHP+golang开源办公系统CRM管理系统

基于ThinkPHP6 Layui MySQL的企业办公系统。集成系统设置、人事管理、消息管理、审批管理、日常办公、客户管理、合同管理、项目管理、财务管理、电销接口集成、在线签章等模块。系统简约&#xff0c;易于功能扩展&#xff0c;方便二次开发。 服务器运行环境要求 PHP > 7.…

AI - 决策树模型

&#x1f914;决策树算法 决策树的思想来源可以追溯到古希腊时期&#xff0c;当时的哲学家们就已经开始使用类似于决策树的图形来表示逻辑推理过程。然而&#xff0c;决策树作为一种科学的决策分析工具&#xff0c;其发展主要发生在20世纪。 在20世纪50年代&#xff0c;美国兰…

mac激活pycharm,python环境安装和包安装问题

1.PyCharm到官网下载就行 地址&#xff1a;Other Versions - PyCharm (jetbrains.com) 2.MacOS 下载python环境&#xff0c;地址&#xff1a; Python Releases for macOS | Python.org 3.PyCharm环境配置&#xff1a; 4. 如果包下载不下来可以换个源试试 pip install py…

【网络原理】TCP 协议中比较重要的一些特性(三)

目录 1、拥塞控制 2、延时应答 3、捎带应答 4、面向字节流 5、异常情况处理 5.1、其中一方出现了进程崩溃 5.2、其中一方出现关机&#xff08;正常流程的关机&#xff09; 5.3、其中一方出现断电&#xff08;直接拔电源&#xff0c;也是关机&#xff0c;更突然的关机&am…

Unity的AssetBundle资源运行内存管理的再次深入思考

大家好&#xff0c;我是阿赵。   这篇文章我想写了很久&#xff0c;是关于Unity项目使用AssetBundle加载资源时的内存管理的。这篇文章不会分享代码&#xff0c;只是分享思路&#xff0c;思路不一定正确&#xff0c;欢迎讨论。   对于Unity引擎的资源内存管理&#xff0c;我…

android studio设置flutter和dart的sdk配置

提示没有配置dart sdk的时候&#xff0c;其实只需要配置一下flutter的sdk就可以了&#xff0c;因为flutter的安装包里面包含了dart的sdk&#xff1a; 按照提示选中这个flutter的安装包路径就可以了&#xff1a; 并且需要开启windows的开发者开关&#xff1a;start ms-settings:…

Oracle 临时表空间管理(Temporary Tablespace)

Oracle临时表空间&#xff08;Temporary Tablespace&#xff09;主要用来存储数据库运行中产生的临时对象&#xff0c;例如SQL排序结果集&#xff0c;临时表等&#xff0c;这些对象的生存周期只有会话。本文总结了Oralce中涉及临时表空间的管理和优化操作。 目录 一、临时表空…

微信小程序(五十八)分步表单多页面传值

注释很详细&#xff0c;直接上代码 上一篇 新增内容&#xff1a; 1.分步表单传值 2.伪数据生成 源码&#xff1a; app.json {"pages": ["pages/index/index","pages/building/building","pages/room/room","pages/logs/logs&quo…

hot100 -- 矩阵

&#x1f442; Peter Pan - kidult. - 单曲 - 网易云音乐 &#x1f442; Bibliothque&#xff08;图书馆&#xff09; - Jasing Rye - 单曲 - 网易云音乐 目录 &#x1f33c;前言 &#x1f33c;二分模板 &#x1f382;矩阵置零 AC 标记数组 AC 标记变量 &#x1f6a9;…

REDHAWK——连接

文章目录 前言一、连接过程二、为什么要使用端口三、端口访问四、动态连接五、标准化数据接口六、BulkIO1、流 API①、数据类型②、输出流<1>、创建<2>、修改流元数据<3>、写入<4>、写入复数数据<5>、写缓冲<6>、关闭 ③、输入流<1>…

手机中的8款万能App推荐!

目录 1.全能AI工具箱——HuluAI 2.AI视频生成——巨日禄 3.全能办公套件——鲸鲮Office 4.视频音频转换器——VideotoMP3Converter 5.特效滤镜摄影——PicsArt 6.智能工具箱——SmartTools 7.手机视频编辑软件——KineMaster 8.安卓版万能文档阅读器——AllDocumentRea…

蓝桥杯单片机快速开发笔记——矩阵键盘

一、原理分析 二、思维导图 三、示例框架 定义了四个位控制变量&#xff0c;用于控制键盘扫描时的行列信号。 在Scan_Keys()函数中&#xff0c;首先设置行列信号&#xff0c;将其中一个行信号置为0&#xff0c;另一个行信号置为1&#xff0c;同时将列信号置为1&#xff0c;用于…