图像处理之《鲁棒图像隐写术:隐藏频率系数中的信息》论文精读

一、文章摘要

隐写术是一种将秘密信息隐藏到公共多媒体对象中而不会引起第三方怀疑的技术。然而,大多数现有的工作不能提供良好的抗有损JPEG压缩鲁棒性,同时保持相对较大的嵌入容量。提出了一种基于可逆神经网络的端到端鲁棒隐写系统。该方法将秘密信息直接隐藏到封面图像的离散余弦变换(DCT)系数中,而不是隐藏在空间域中,显著提高了鲁棒性和抗隐写安全性。首先提出了互信息损失来约束INN中的信息流。实现了双向融合模块(TWFM),利用空间域和DCT域特征作为辅助信息,便于信息提取。这两种设计有助于从DCT系数中无损地恢复秘密消息。实验结果表明,该方法的误差率明显低于其他现有的隐藏方法。例如,我们的方法在每像素1比特(bpp)的嵌入负载下实现了0错误率的可靠提取;在质量因子QF = 10的JPEG压缩条件下,该方法的错误率比现有的鲁棒图像隐藏方法低22%左右,对JPEG压缩具有较好的鲁棒性。

在这里插入图片描述
二、提出的方法

2.1 框架概述

传统的神经网络利用两个独立的编码器和解码器对秘密消息M、封面图像C和隐写图像S之间的映射进行建模,可以表示为:(M,C)->S和S->(M,C)。这种单独的编码器-解码器结构将导致不准确的双射映射,并可能将一个映射的误差累积到另一个映射中。在我们提出的方法中,我们试图找到一个可以同时隐藏和提取秘密消息的可逆双射网络,表示为:(M,C) <-> s。在图2中,我们的方法框架由几个部分组成:INN、JPEG压缩层、鉴别器和双向融合模块。我们使用仿射耦合层来构造隐藏和显示块。有12个这样的可逆块用于隐藏和显示INN的过程。这两个过程在训练过程中共享参数,这比传统的编码器-解码器架构更有效地驱动模型。JPEG压缩层是一个模拟器,将不可微的JPEG压缩模拟成可微的近似形式,然后将其引入到端到端网络中,以减轻失真影响,有效地提高鲁棒性。利用对抗性鉴别器区分生成的隐写图像与原始封面图像是否相似,利用对抗性学习提高生成的隐写图像的视觉保真度和隐写安全性。TWFM经过精心设计,充分结合了空间和DCT域的特征来恢复信息。

在这里插入图片描述
图2 提出的隐写体系结构概述

2.2 可逆隐藏/揭示过程

我们表示具有c个通道和h × w大小的封面图像为c ={0,…, 255}c×h×w,其中c = 3,h = 256,w = 256。将秘密消息记为m={0,1}l,长度为1。为了保证INN的两个输入大小相同,我们将秘密消息输入作为一个三维体积来管理,如果有效载荷小于1 bpp,我们将每个具有相同值的比特填充到8×8小块中。已成形的秘密消息表示为M={0,1}c’×h×w,其中c’为通道数。在前向隐藏过程中,对封面图像进行DCT变换,形成与空间图像大小相同的三维DCT系数立方体。然后利用隐藏块将秘密信息M嵌入到封面图像的DCT系数Cdct中。考虑图2中的第i个隐藏块,我们输入Cidct和Mi,输出Ci+1dct和Mi+1,可表示为:
在这里插入图片描述

其中⊙表示阿达玛尔积运算,(·),ρ(·)和η(·)表示任意函数,但不要求可逆。在这里,我们使用5层Denseblock (Wang等人2018)来表示这三个函数,以获得令人满意的图像处理性能。需要注意的是,经过一系列的隐藏块后,模型输出隐写图像的DCT系数Sdct和丢失的信息矩阵L。为了得到相应的隐写图像S,IDCT模块接收频率特征Sdct并将其变换回空间域。

在反向揭示过程中,DCT模块接收到被攻击的隐写图像Sa,并将其转换为DCT特征Sdcta。由于在通信信道上只能传输被攻击的隐写图像,因此我们将被攻击的隐写图像Sa保存在揭示过程的开始。因此,为了替换丢失的信息矩阵L,提炼必要的信息进行揭示,TWFM将被攻击的隐写图像Sa及其频率系数Sdcta合并生成辅助变量矩阵z。下面将介绍TWFM的详细结构。我们注意到,除了信息流动方向相反之外,隐藏块和显示块几乎是相同的。对于第i个揭示块,输入为Si+1dct_a和Zi+1,根据下式得到输出为Si dct _a和Zi:
在这里插入图片描述

其中,⊘表示矩阵的除法运算。最后一个显示块输出恢复的封面图像的DCT系数C’dct和恢复的消息M0。最终,C’dct通过IDCT模块转换为恢复的封面图像C’,M’重新塑造并映射回二进制消息m’。

2.3 双向融合模块(TWFM)

在封面图像中隐藏秘密信息时,高容量嵌入不可避免地会对载体造成损害。此外,为了避免生成的隐写图像的视觉失真,很难将秘密信息完全嵌入到载体中。这样,上述两个信息损失就构成了丢失的信息矩阵L。工作 (Jing等人2021)从高斯分布中随机抽取样本组成辅助变量矩阵Z。然后对每个采样的Z进行训练,以确保INN能够恢复秘密消息。然而,这种方法并没有充分考虑到L包含来自输入特征的有效信息,这些信息应该在揭示过程中尽可能地利用。也就是说,丢弃L将导致秘密消息恢复的准确性降低

自注意机制(Vaswani等人2017)将输入映射到几个不同的patch中,以捕获特征的内部相关性,TWFM旨在有效地提取和融合空间域和频率域特征,以提高秘密消息恢复的准确性。TWFM的体系结构如图3所示。输入是攻击后的隐写图像Sa及其频率特征Sdct_a。注意权重映射通过元素积在空间域和频域为相应的特征分配0 ~ 1之间的权重。它从Sa和Sdct_a中选择有意义的特征,同时抑制一些无关的细节。整个过程可以描述如下:
在这里插入图片描述

其中⊗是元素积运算,σ(·)、δ(·)和fc(·)分别表示softmax函数、concat操作和卷积。注意权重映射W表示从输入特征矩阵中获得的区域信息的重要性,其中需要更多地关注高权重元素。请注意,TWFM是即插即用的,也就是说,它可以与INN进行端到端联合训练
在这里插入图片描述
图3 双向融合模块的架构

2.4 JPEG压缩层的设计

JPEG压缩过程包含一个不可微的步骤:舍入函数是截断梯度传播的分段步骤函数。因此,JPEG不适合直接进行端到端训练优化。为了解决这一问题,我们在工作中采用平滑舍入函数R (x) (Shin and Song 2017)来模拟舍入步骤,可以表示为:
在这里插入图片描述

式中[x]为x的舍入运算,R(x)为量化模拟的舍入DCT系数。模拟的舍入函数R(x)近似连续,说明其导数不为零。通过这种方法,可以将不可微的JPEG压缩以可微的形式进行模拟,从而在训练过程中保持梯度传播

2.5 鉴别器的设计

鉴别器评估封面图像和隐写图像之间的差异,并提供关于生成器性能的反馈,这进一步刺激生成的实例更接近原始类的数据。在我们提出的方法中,鉴别器模块由6组组成。从第1组到第5组,每组由一个卷积层(kernel size = 3,stride = 2,padding = 1)、一个BN层和一个LeakyReLU激活函数组成。组6包含一个全局平均池化(GAP)和一个输出分类概率的线性层。得益于对抗学习的基本原理,生成的隐写图像具有更高的视觉保真度和抗统计检测的隐写安全性。

2.6 损失函数

为了生成高保真的隐写图像,恢复低误差的信息,总体优化目标为:
在这里插入图片描述
其中λc,λr,λd和λm是平衡不同损失项的权重因子。

隐藏损失Lc隐藏损失Lc表示封面图像C和隐写图像S的区别。隐藏损失需要控制在一个合适的水平,以获得良好的隐蔽性。我们用均方误差(MSE)来衡量它们之间的差异,其定义为:
在这里插入图片描述

揭示损失Lr揭示损失Lr表示恢复的消息M’与原始秘密消息M之间的差异,希望低的揭示损失能够获得较高的消息恢复精度,可以表示为:
在这里插入图片描述

鉴别损失Ld利用辨别损失来增强生成的隐写图像的视觉保真度和网络的抗隐写能力,其中交叉熵损失函数描述如下:
在这里插入图片描述
其中yi为原始真实标签(cover为0,stego为1)。pi表示鉴别器的分类概率。

互信息损失Lm互信息反映了两个变量之间的相关性:一个变量中包含的关于另一个变量的信息量。在图2中,前向隐藏过程以秘密消息M为输入,丢失信息矩阵L为输出。理想情况下,当它们之间的互信息接近于0时,可以假设L的分布与输入m的分布无关,此时我们可以丢弃L而不呈现信息丢失以供揭。因此,为了在嵌入中保持有效信息,提出了互信息损失Lm来约束信息流的方向。它可以定义为:
在这里插入图片描述

式中H (M)和H (L)表示信息熵,H (M,L)表示M和L的联合熵,信息熵和联合熵的计算公式为:
在这里插入图片描述

其中N为矩阵中不同像素值的个数,Pi为矩阵中出现值为i的像素的概率。PML(i,j)是同一位置的像素在矩阵M中值为i,在矩阵L中值为j的概率。

三、实现细节

数据集和实现细节。用于训练和测试的数据集是MSCOCO (Lin等人2014)。我们随机选择5000张图片作为训练的封面图片,1000张图片作为测试的封面图片。上面用于训练或测试的封面图像不重叠,并且使用MATLAB的中心裁剪策略以256 × 256的分辨率裁剪。采用标准参数的Adam优化器(Kingma and Ba 2014)对我们的网络进行优化。初始学习率设置为0.0001,批量大小设置为2以适应我们的设备。整个训练过程包括120个阶段。整个框架由PyTorch实现,并在NVIDIA GeForce RTX 2080 Ti上执行。在训练结束时,模型已经充分收敛。权重因子λc、λr、λd、λm分别设为1.0、15.0、3.0、5.0

评价指标。我们从以下几个方面对业绩进行评估。采用峰值信噪比(PSNR) (Welstead 1999)和结构相似性指数(SSIM) (Wang等人2004)作为图像质量评估。使用误码率(BER)来衡量鲁棒性,误码率越低,表示恢复的消息m’更接近原始消息m。由于恢复的消息m’是浮点数,因此我们将m0中大于0.5的位映射为1,其余位映射为0。在隐写安全性方面,检测误差表明隐写分析网络无法区分特定隐写方法产生的封面图像/隐写图像。

四、汇报PPT(作者本人)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

论文地址:Robust Image Steganography: Hiding Messages in Frequency Coefficients

没有公布源码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2777473.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

【开源】基于JAVA+Vue+SpringBoot的智慧社区业务综合平台

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 业务类型模块2.2 基础业务模块2.3 预约业务模块2.4 反馈管理模块2.5 社区新闻模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 业务类型表3.2.2 基础业务表3.2.3 预约业务表3.2.4 反馈表3.2.5 社区新闻表 四、系统展…

【Python中Selenium元素定位的各种方法】

1、元素定位操作&#xff1a; 2、创建浏览器驱动操作&#xff0c;导入By模块&#xff1a; from selenium import webdriver # 用于界面与浏览器互动 from selenium.webdriver.common.by import By # 用于元素定位 driver webdriver.Chrome() # 调用Chrome类&#xff0c;创…

知识图谱与图神经网络融合:构建智能应用的新前沿

目录 前言1 知识图谱表示学习1.1 典型模型1.2 下游任务 2 图神经网络与知识图谱表示学习2.1 Compgcn&#xff1a;合成图卷积模型2.2 知识图谱嵌入在归纳设置下的推进 3 图神经网络与知识图谱构建3.1 关系抽取的进阶应用3.2 结构信息补全与知识图谱的完整性 4 图神经网络与知识图…

基于css-vars-ponyfill实现换肤

文章目录 一、换肤二、换肤调研2.1、ElementUI2.2、ant.design 三、换肤痛点和思考四、换肤架构五、换肤技术选型和实现5.1、该方案的亮点和规则5.2、核心原理5.3、色组 & 色值平台设计5.4、获取在当前主题自定义变量颜色 六、总结七、最后 一、换肤 网站或者应用一键切换…

【大厂AI课学习笔记】【1.5 AI技术领域】(8)文本分类

8,9,10&#xff0c;将分别讨论自然语言处理领域的3个重要场景。 自然语言处理&#xff0c;Natual Language Processing&#xff0c;NLP&#xff0c;包括自然语言识别和自然语言生成。 用途是从非结构化的文本数据中&#xff0c;发掘洞见&#xff0c;并访问这些信息&#xff0…

Flume安装部署

安装部署 安装包连接&#xff1a;链接&#xff1a;https://pan.baidu.com/s/1m0d5O3Q2eH14BpWsGGfbLw?pwd6666 &#xff08;1&#xff09;将apache-flume-1.10.1-bin.tar.gz上传到linux的/opt/software目录下 &#xff08;2&#xff09;解压apache-flume-1.10.1-bin.tar.gz…

【Spring框架】Spring事务同步

目录 一、什么是Spring事务同步 二、 事务同步管理器 2.1 TransactionSynchronizationManager事务同步管理器 2.1.1 资源同步 2.1.2 事务同步 2.1.3 总结 三、事务同步管理器保障事务的原理 四、spring事务为何使用TransactionSynchronizationManager spring源码实现 …

书生·浦语大模型第三课作业

基础作业&#xff1a; 复现课程知识库助手搭建过程 (截图) 进阶作业&#xff1a; 选择一个垂直领域&#xff0c;收集该领域的专业资料构建专业知识库&#xff0c;并搭建专业问答助手&#xff0c;并在 OpenXLab 上成功部署&#xff08;截图&#xff0c;并提供应用地址&#x…

【Web】基于Mybatis的SQL注入漏洞利用点学习笔记

目录 MyBatis传参占位符区别 不能直接用#{}的情况 in多参数值查询 like %%模糊查询 order by列名参数化 MyBatis传参占位符区别 在 MyBatis 中&#xff0c;#{} 和 ${} 都是用于传参的占位符&#xff0c;但它们之间有很大的区别&#xff0c;主要体现在两个方面&#xff1a…

计算机网络基础 第四章——介质访问控制子层 知识点(上)

4.1局域网技术的发展与演变 1.访问控制的基本概念 介质访问控制(MAC)是所有“共享介质"类型的局域网都必须解决的共性问题。理解 介质访问控制方法的基本概念,需要注意以下两个问题。 (1)对术语“共享介质”、“多路访问”与“冲突"的理解 由于“共享介质”与“多…

如何开发一个游戏平台?

随着科技的进步和互联网的普及&#xff0c;游戏行业正在迅速发展。游戏平台的开发已成为游戏行业的一个重要组成部分。开发一个游戏平台需要深入了解游戏行业&#xff0c;掌握相关技术&#xff0c;并具备创新思维。以下是一些关于如何开发一个游戏平台的建议&#xff1a; 市场调…

STL - map 和 set

1、关联式容器 vector、list、deque、 forward_list(C11)等&#xff0c;这些容器统称为序列式容器&#xff0c;因为其底层为线性序列的数据结构&#xff0c;里面 存储的是元素本身 关联式容器也是用来存储数据的&#xff0c;与序列式容器不同的是&#xff0c;其里面存储的是<…

Nginx 配置 SSL证书

成功配置SSL证书后&#xff0c;您将能够通过HTTPS加密通道安全访问Nginx服务器。 一、准备材料 SSL证书绑定的域名已完成DNS解析&#xff0c;即您的域名与主机IP地址相互映射。您可以通过DNS验证证书工具&#xff0c;检测域名DNS解析是否生效。具体操作&#xff1a; 【1】登录…

Three.js学习8:基础贴图

一、贴图 贴图&#xff08;Texture Mapping&#xff09;&#xff0c;也翻译为纹理映射&#xff0c;“贴图”这个翻译更直观。 贴图&#xff0c;就是把图片贴在 3D 物体材质的表面&#xff0c;让它具有一定的纹理&#xff0c;来为 3D 物体添加细节的一种方法。这使我们能够添加…

numpy 查漏补缺

1. iterating 2. 3. 4. 5. 6. 7. 8. 9.

Blender教程(基础)--试图的显示模式-22

一、透视模式&#xff08;AltZ&#xff09; 透视模式下可以实现选中透视的物体信息 发现选中了透视区的所有顶点 二、试图着色模式-显示网格边框 三、试图着色模式-显示实体 三、试图着色模式-材质预览 四、试图着色模式-显示渲染预览

test222

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起探讨和分享Linux C/C/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。 磁盘满的本质分析 专栏&#xff1a;《Linux从小白到大神》 | 系统学习Linux开发、VIM/GCC/GDB/Make工具…

开源微服务平台框架的特点是什么?

借助什么平台的力量&#xff0c;可以让企业实现高效率的流程化办公&#xff1f;低代码技术平台是近些年来较为流行的平台产品&#xff0c;可以帮助很多行业进入流程化办公新时代&#xff0c;做好数据管理工作&#xff0c;从而提升企业市场竞争力。流辰信息专业研发低代码技术平…

【GO语言卵细胞级别教程】03.条件与循环语句

注意&#xff1a;以下演示所用的项目&#xff0c;在第一章节已经介绍了&#xff0c;这里不做赘述 目录&#xff1a; 【GO语言卵细胞级别教程】03.条件与循环语句1.条件语句1.1 if语句1.1.1 单层if语句1.1.2 if-else语句1.1.3 if-else-if 语句1.1.4 if 嵌套 1.2 switch 语句1.1…

问题:老年人心理健康维护与促进的原则为________、________、发展原则。 #媒体#知识分享

问题&#xff1a;老年人心理健康维护与促进的原则为________、________、发展原则。 参考答案如图所示