信息熵为凹函数-推导

凹函数和凸函数,是凹凸是相对于x轴来说的,对于熵来说,它是凹函数。因为它是-log函数,函数曲线相对于x轴来说是凸的。

Jensen不等式推导

以下是证明熵是凹函数。

引理:

①Jensen不等式,条件:对于实数域上的凸函数f,如果x是一个随机变量,则不等式可以表述为: f ( E [ x ] ) ≤ E [ f ( x ) ] f(E[x])\leq E[f(x)] f(E[x])E[f(x)],意为自变量均值的函数值(曲线上的值)≤自变量函数值的均值(直线上的值)。

②利用Jensen不等式判定函数为凹或凸。

凸:如果对于所有的x,y和所有t ∈ [ 0 , 1 ] \in[0,1] [0,1],满足: f ( t ⋅ x + ( 1 − t ) ⋅ x ) ≤ t ⋅ f ( x ) + ( 1 − t ) ⋅ f ( x ) f(t \cdot x\ +\ (1-t)\cdot x)\leq t\cdot f(x) \ +\ (1-t)\cdot f(x) f(tx + (1t)x)tf(x) + (1t)f(x),则为凸函数——直线上的点y值要比曲线上的点y值大。

凹:则相反。

因为-log函数是凸函数。所以, − log ⁡ ( t ⋅ x + ( 1 − t ) ⋅ x ) ≥ t ⋅ ( − log ⁡ ( x ) ) + ( 1 − t ) ⋅ ( − log ⁡ ( x ) ) -\log(t\cdot x+ (1-t)\cdot x)\geq t\cdot (-\log(x)) + (1-t)\cdot (-\log(x)) log(tx+(1t)x)t(log(x))+(1t)(log(x))

H ( λ p + ( 1 − λ ) q ) ) = ∑ i = 1 n − ( λ p i + ( 1 − λ ) q i ) ⋅ log ⁡ ( λ p i + ( 1 − λ ) q i ) = ∑ i = 1 n ( λ p i + ( 1 − λ ) q i ) ⋅ − log ⁡ ( λ p i + ( 1 − λ ) q i ) ≥ ∑ i = 1 n ( λ p i + ( 1 − λ ) q i ) ( λ ⋅ − log ⁡ p i + ( 1 − λ ) ( − log ⁡ q i ) ) = ∑ i = 1 n ( λ p i ⋅ − log ⁡ p i + λ p i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) + ( 1 − λ ) q i ⋅ − log ⁡ p i + ( 1 − λ ) q i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) = ∑ i = 1 n ( λ p i ⋅ − log ⁡ p i + ( 1 − λ ) q i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) + ∑ i = 1 n ( λ p i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) + ( 1 − λ ) q i ⋅ − log ⁡ p i ) ≥ ∑ i = 1 n ( λ p i ⋅ − log ⁡ p i + ( 1 − λ ) q i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) = λ 2 H ( p ) + ( 1 − λ ) 2 H ( q ) = λ H ( p ) + ( 1 − λ ) H ( q ) H(\lambda p + (1- \lambda) q))=\sum_{i=1}^n-(\lambda p_i+(1-\lambda ) q_i)\cdot \log(\lambda p_i+(1-\lambda )q_i)\\ =\sum_{i=1}^n(\lambda p_i+(1-\lambda ) q_i)\cdot -\log(\lambda p_i+(1-\lambda )q_i)\\ \geq \sum_{i=1}^n (\lambda p_i+(1-\lambda)q_i) (\lambda \cdot -\log p_i+(1-\lambda) (-\log q_i))\\=\sum_{i=1}^n(\lambda p_i\cdot -\log p_i + \lambda p_i \cdot (1-\lambda) (-\log q_i)) + (1-\lambda)q_i \cdot -\log p_i+ (1-\lambda)q_i \cdot (1-\lambda) (-\log q_i))\\=\sum_{i=1}^n(\lambda p_i\cdot -\log p_i + (1-\lambda)q_i \cdot (1-\lambda) (-\log q_i))+\sum_{i=1}^n(\lambda p_i \cdot (1-\lambda) (-\log q_i)) + (1-\lambda)q_i \cdot -\log p_i)\\\geq\sum_{i=1}^n(\lambda p_i\cdot -\log p_i + (1-\lambda)q_i \cdot (1-\lambda) (-\log q_i))\\ =\lambda^2 H(p)+(1-\lambda)^2H(q)\\=\lambda H(p)+(1-\lambda)H(q) H(λp+(1λ)q))=i=1n(λpi+(1λ)qi)log(λpi+(1λ)qi)=i=1n(λpi+(1λ)qi)log(λpi+(1λ)qi)i=1n(λpi+(1λ)qi)(λlogpi+(1λ)(logqi))=i=1n(λpilogpi+λpi(1λ)(logqi))+(1λ)qilogpi+(1λ)qi(1λ)(logqi))=i=1n(λpilogpi+(1λ)qi(1λ)(logqi))+i=1n(λpi(1λ)(logqi))+(1λ)qilogpi)i=1n(λpilogpi+(1λ)qi(1λ)(logqi))=λ2H(p)+(1λ)2H(q)=λH(p)+(1λ)H(q)
因为 q i q_i qi p i p_i pi都是0-1的概率,所以一长串要大于单独的剩下两项。同时,尽管最后有 λ 2 \lambda^2 λ2 ( 1 − λ ) 2 (1-\lambda)^2 (1λ)2,因为关注的是线性组合,这都是常数,可以改写成另一种常数,(这里我不确定是否合理,希望小伙伴多多指正)所以这是最后的化简结果。

最后得到 H ( λ p + ( 1 − λ ) q ) ≥ λ H ( p ) + ( 1 − λ ) H ( q ) H(\lambda p+(1-\lambda)q)\geq\lambda H(p)+(1-\lambda)H(q) H(λp+(1λ)q)λH(p)+(1λ)H(q),即熵是凹函数。

这是利用了Jensen不等式来辅助证明的。

下面知乎博客的证明式子更直接简单易于理解。直接看图。

image-20240508114904820

GPT推导

GPT给的回答是这样,但现在理解不了。

好的,让我们重新审视熵是凹函数这一性质,并结合之前的讨论。

我们知道熵$ ( H(X) ) $的定义为:

[ H ( X ) = − ∑ x P ( x ) log ⁡ P ( x ) ] [ H(X) = - \sum_{x} P(x) \log P(x) ] [H(X)=xP(x)logP(x)]

我们需要证明熵的二阶导数是负的,即$ ( \frac{{d2H}}{{dx2}} < 0 )$。

首先,我们计算一阶导数:

[ d H d x = − ∑ x ( d P ( x ) d x log ⁡ P ( x ) + P ( x ) d ( log ⁡ P ( x ) ) d x ) ] [ \frac{{dH}}{{dx}} = - \sum_{x} \left( \frac{{dP(x)}}{{dx}} \log P(x) + P(x) \frac{{d(\log P(x))}}{{dx}} \right) ] [dxdH=x(dxdP(x)logP(x)+P(x)dxd(logP(x)))]

接着,计算二阶导数:

[ d 2 H d x 2 = − ∑ x ( d 2 P ( x ) d x 2 log ⁡ P ( x ) + 2 d P ( x ) d x d ( log ⁡ P ( x ) ) d x + P ( x ) d 2 ( log ⁡ P ( x ) ) d x 2 ) ] [ \frac{{d^2H}}{{dx^2}} = - \sum_{x} \left( \frac{{d^2P(x)}}{{dx^2}} \log P(x) + 2 \frac{{dP(x)}}{{dx}} \frac{{d(\log P(x))}}{{dx}} + P(x) \frac{{d^2(\log P(x))}}{{dx^2}} \right) ] [dx2d2H=x(dx2d2P(x)logP(x)+2dxdP(x)dxd(logP(x))+P(x)dx2d2(logP(x)))]

现在,让我们考虑概率分布$ ( P(x) ) $的条件:

  1. 所有的概率值都必须是非负的: ( P ( x ) ≥ 0 ) ( P(x) \geq 0 ) (P(x)0),对于所有的$ ( x )$。
  2. 所有概率值的总和必须为1: ( ∑ x P ( x ) = 1 ) ( \sum_{x} P(x) = 1 ) (xP(x)=1)

根据上述讨论,我们知道 ( P ( x ) ) ( P(x) ) (P(x))是非负的,因此 ( d P ( x ) d x ) ( \frac{{dP(x)}}{{dx}} ) (dxdP(x))也是非负的。对数函数的二阶导数是负的。因此,我们可以得出结论:

  1. ( d 2 P ( x ) d x 2 ) ( \frac{{d^2P(x)}}{{dx^2}} ) (dx2d2P(x))是非负的。
  2. ( d 2 ( log ⁡ P ( x ) ) d x 2 ) ( \frac{{d^2(\log P(x))}}{{dx^2}} ) (dx2d2(logP(x)))是负的。

由于所有的概率值 ( P ( x ) ) (P(x)) (P(x)) 的总和为1,因此其一阶导数 ( f r a c d P ( x ) d x ) ( frac{{dP(x)}}{{dx}} ) (fracdP(x)dx)的积分为0。这意味着对数函数的一阶导数 ( d ( log ⁡ P ( x ) ) d x ) ( \frac{{d(\log P(x))}}{{dx}} ) (dxd(logP(x)))的积分也为0。

综合以上结果,我们可以得出结论:熵 ( H ( X ) ) ( H(X) ) (H(X))的二阶导数是负的,即 ( H ( X ) ) ( H(X) ) (H(X))是凹函数。

这个证明表明,无论概率分布 ( P ( x ) ) ( P(x) ) (P(x))是如何变化的,其熵的凹性质始终成立,这是信息论中一个重要的性质。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3019639.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot框架如何接入RocketMQ?

目录 一、SpringBoot框架介绍 二、RocketMQ介绍 三、RocketMQ的应用场景 四、SpringBoot框架如何接入RocketMQ 一、SpringBoot框架介绍 Spring Boot是一个开源的Java框架,它基于Spring框架,旨在简化Java应用程序的开发。Spring Boot通过自动化配置和约定优于配置的原则,大…

谷歌开源!用 js 编写 Shell 脚本! | 开源日报 No.247

google/zx Stars: 41.4k License: Apache-2.0 zx 是一个用于编写更好脚本的工具。 提供有用的包装器&#xff0c;简化了对 child_process 的操作转义参数并提供合理的默认值使用 JavaScript 编写复杂脚本时比 Bash 更方便可以直接使用 npm 安装 dani-garcia/vaultwarden St…

评估Transitions

Stateflow使用图表中的转换从一种OR状态移动到另一种OR状态。对于图表执行的输入和执行工作流,Stateflow评估转换以确定它们是否有效。有效转换是条件标签为true且路径以状态结束的转换。如果转换有效,则Stateflow将从源状态退出并进入目标状态。 评估Transitions的工作流 T…

图搜索算法 - 拓扑排序

相关文章&#xff1a; 数据结构–图的概念 图搜索算法 - 深度优先搜索法&#xff08;DFS&#xff09; 图搜索算法 - 广度优先搜索法&#xff08;BFS&#xff09; 拓扑排序 概念 几乎所有的工程都可分为若干个称作活动的子工程&#xff0c;而这些子工程之间&#xff0c;通常受…

Debug项目失败Run成功

一&#xff1a;问题 idea中启动服务&#xff0c;服务一直在启动中&#xff0c;最后超时启动失败 重新构建项目也是一样 二&#xff1a;个人分析 debug因为断点太多了项目起不起来&#xff0c;试一下run直接运行&#xff0c;项目可以快速启动 三&#xff1a;解决办法 在控制…

四、Redis五种常用数据类型-List

List是Redis中的列表&#xff0c;按照插入顺序保存数据&#xff0c;插入顺序是什么样的&#xff0c;数据就怎么保存。可以添加一个元素到列表的头部(左边)或者尾部(右边)。一个列表最多可以包含232-1个元素(4294967295&#xff0c;每个列表超过40亿个元素)。是一种双向列表结构…

uniapp 如何修改 IPA 文件信息页的本地化语言

实现效果&#xff1a; 最终会对应到苹果商店的语言&#xff1a; 例如微信的语言就有多个&#xff1a; 操作&#xff1a; 在 mainfest.json 源码视图中加入&#xff1a; 具体对应的语言key值可以参考Xcode中的语言代码 这个取决于打包后的 lproj 文件 将后缀ipa改成zip打开即…

47. UE5 RPG 实现角色死亡效果

在上一篇文章中&#xff0c;我们实现了敌人受到攻击后会播放受击动画&#xff0c;并且还给角色设置了受击标签。并在角色受击时&#xff0c;在角色身上挂上受击标签&#xff0c;在c里&#xff0c;如果挂载了此标签&#xff0c;速度将降为0 。 受击有了&#xff0c;接下来我们将…

Linux中gitlab-runner部署使用备忘

环境&#xff1a; 操作系统:&#xff1a;CentOS8 gitlab版本&#xff1a;13.11.4 查看gitlab-runner版本 可以从https://packages.gitlab.com/app/runner/gitlab-runner/search找到与安装的gitlab版本相近的gitlab-runner版本以及安装命令等信息&#xff0c;我找到与13.11.4相…

C语言,实现数字谱到简谱的转换(二)

C语言&#xff0c;实现数字谱到简谱的转换&#xff08;二&#xff09; 前言&#xff1a;本文初编辑于2024年5月8日 CSDN&#xff1a;https://blog.csdn.net/rvdgdsva 博客园&#xff1a;https://www.cnblogs.com/hassle 前言 结合前文使用 之前的程序默认C调4/4拍&#xff…

windows11获取笔记本电脑电池健康报告

笔记本电脑的电池关系到我们外出时使用的安全&#xff0c;如果电池健康有问题需要及时更换&#xff0c;windows系统提供了检查电池健康度的方法。 1、打开命令行 1&#xff09;键入 winR 2&#xff09;键入 cmd 打开命令行。 2、在命令行运行如下指令&#xff0c;生成电池健…

美式期权和欧式期权区别的详细解析

美式期权和欧式期权的区别 美式期权和欧式期权是期权交易的两种主要形式&#xff0c;它们主要在行权时间、灵活性和价格等方面存在显著的区别。 文章来源/&#xff1a;股指研究院 美式期权的特点在于其买方可以在期权有效期内任何一天提出执行合约&#xff0c;即买方可以在到…

人工智能哪些大学比较好

人工智能领域的大学有很多&#xff0c;以下是一些国际上被广泛认可的一流大学&#xff1a; 1. **斯坦福大学&#xff08;Stanford University&#xff09;** - 位于美国加州的斯坦福大学拥有顶尖的人工智能研究中心&#xff0c;并在机器学习、自然语言处理等领域处于领先地位。…

怿星科技CEO潘凯:汽车软件研发工具链 国产玩家迎「历史性机会」

「智能汽车时代&#xff0c;国内非常有机会出现类似Vector的企业。」 这是怿星科技CEO潘凯深信的事情&#xff0c;他在行业内已经深耕约18年&#xff0c;创业也已经10年有余&#xff0c;带领着一个约300人的公司&#xff0c;2024年4月与高工智能汽车见面时&#xff0c;正值公司…

pdf2htmlEX:pdf 转 html,医学指南精细化处理

pdf2htmlEX&#xff1a;pdf 转 html&#xff0c;医学指南精细化处理 单文件转换多文件转换 代码&#xff1a;https://github.com/coolwanglu/pdf2htmlEX 拉取pdf2htmlEX 的 Docker&#xff1a; docker pull bwits/pdf2htmlex # 拉取 bwits/pdf2htmlex不用进入容器&#xff0c…

初学C++——C++基础、变量、字面量、常量、数据类型、类型转换、变量命名规则、开发环境配置

文章目录 简介C 语言的特性C 开发环境配置C 变量&#xff0c;字面量和常量C 变量变量命名规则 C 字面量C 常量 C 数据类型C 基本数据类型派生数据类型 C 类型转换隐式类型转换C 显式转换 简介 C 是一种静态类型的&#xff0c;自由形式的&#xff08;通常&#xff09;编译的&…

一文详解Spring与JDK注入

目录 一、Spring框架 二、JDK 三、什么是Spring的注入 四、如何实现Spring与JDK注入 一、Spring框架 Spring框架是一个开源的Java EE应用程序框架&#xff0c;它为企业级Java应用程序提供了全面的基础设施支持。Spring框架的核心特点包括依赖注入&#xff08;Dependency I…

存储大作战:探索Local Storage与Session Storage的奥秘

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 存储大作战&#xff1a;探索Local Storage与Session Storage的奥秘 前言Local Storage与Session Storage简介数据存储生命周期容量限制安全性 前言 在Web的世界里&#xff0c;数据就像是一群流浪者&a…

如何利用AI提高内容生产效率

目录 一、自动化内容生成 二、内容分发与推广 三、内容分析与优化 图片来源网络&#xff0c;侵权联系可删 一、自动化内容生成 随着AI技术的飞速发展&#xff0c;自动化内容生成已经成为提高内容生产效率的重要手段。AI可以通过自然语言处理&#xff08;NLP&#xff09;、机…

vue2 14个指令详解,v-bind操作style,v-bind操作class,以及v-bind动态绑定图片地址不生效的问题

文章目录 vue常用指令内容渲染指令v-textv-html 条件渲染指令v-showv-ifv-else、v-else-iftemplate标签 事件绑定指令v-on事件处理函数传参事件处理函数的事件对象 属性绑定指令v-bind 双向绑定指令v-modelv-model的双向绑定实现原理用在表单元素上用在组件实现父子数据双向绑定…