Understanding Deep Image Representations by Inverting Them(2014)


文章目录

  • Abstract
  • Introduction
    • Contribution
  • -
  • Summary

hh

Abstract

从SIFT和视觉词袋到卷积神经网络(cnn),图像表示几乎是任何图像理解系统的关键组成部分。然而,我们对它们的了解仍然有限。在本文中,我们通过提出以下问题对表征中包含的视觉信息进行直接分析:给定图像的编码,在多大程度上可以重构图像本身?为了回答这个问题,我们提出了一个纵向表示的一般框架。我们表明,这种方法可以比最近的替代方法更准确地反演HOG和SIFT等表示,同时也适用于cnn。然后,我们第一次使用这种技术来研究最新的CNN图像表示的逆。在我们的研究结果中,我们发现cnn中的几个层保留了图像的精确信息,具有不同程度的几何和光度量不变性。

Introduction

在本文中,我们通过表征它们保留的图像信息(图1)来对表征进行直接分析。我们通过将表征建模为图像x的函数Φ(x),然后计算近似逆Φ - 1,从代码Φ(x)重建x来实现。一种常见的假设是,表示分解了图像中不相关的差异(例如照明或观点),因此Φ不应该是唯一可逆的。因此,我们将此作为一个重建问题,并找到许多可能的重建而不是单一的重建。通过这样做,我们可以深入了解表示所捕获的不变性。

图中显示了在ImageNet数据上训练的参考CNN13的倒数第二层提取的1000维代码获得的参考图像的五种可能的重建。从模型的角度来看,所有这些图像实际上是等效的。这幅图像以彩色/屏幕观看效果最好。

Contribution

首先,我们提出了一种通用的方法来反转表征,包括SIFT、HOG和cnn(第2节)。至关重要的是,该方法仅使用来自图像表征的信息和一般的自然图像先验,从随机噪声开始作为初始解,因此仅捕获表征本身包含的信息。我们讨论并评价了不同的正则化惩罚作为自然图像先验。

其次,我们表明,尽管该方法简单且通用,但与最近的替代方法相比,该方法从DSIFT和HOG中恢复的重建效果明显更好[31]。

第三,我们将反演技术应用于最近的深度cnn分析,通过采样可能的近似重构来探索它们的不变性。
第四,我们通过从选定的神经元组中重构图像来研究存储在表征中的信息的局部性,无论是空间还是通道

-

自然图像先验的重要性:
使用自然图像先验是基于以下几点考虑:
结构约束:自然图像通常具有特定的结构和规律,如局部相似性、平滑过渡和边缘清晰等。利用这些先验知识可以帮助生成更符合真实视觉效果的反向图像。
规模性和一致性:自然图像的特性往往在不同的尺度和视角上保持一致。利用自然图像先验可以确保反转得到的图像在这些方面的表现合理。
去噪和正则化:自然图像先验可以作为正则化项,帮助去除反转过程中的噪声和不稳定性,从而得到更清晰、更准确的图像表示。

在深度神经网络中,卷积层负责提取输入图像的特征。其激活可以被理解为以下几点:
局部特征响应:每个卷积核在图像上滑动并计算元素间的乘积累加,产生的激活值反映了图像在该位置和尺度上的特定特征(如边缘、纹理、颜色等)的强度。
分层抽象:随着网络深度的增加,高层卷积层的激活通常表示更复杂、更抽象的特征。早期层可能捕捉到基本的低级特征,而后期层则可能表示高级的语义或概念信息。
变换不变性:通过训练,卷积神经网络学会了对图像的某些变换(如旋转、缩放、平移等)保持不变的特征表示。因此,卷积层的激活也可以反映图像在这些变换下的不变性质。

Summary

本文提出了一种基于梯度下降优化目标函数的浅表示和深表示反演优化方法。与替代方案相比,一个关键的区别是使用图像先验,如V β范数,可以恢复被表示删除的低级图像统计。该工具比其他HOG重建方法性能更好。应用于CNNs,可视化揭示了每一层所表示的信息。特别是,很明显,在网络中形成了一个越来越不变和抽象的图像内容概念。
在未来,我们将尝试更有表现力的自然图像先验,并分析网络超参数对重建的影响。我们将提取编码对象部分的神经元子集,并尝试建立捕获图像不同细节的子网络。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2660346.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Mybatis行为配置之Ⅱ—结果相关配置项说明

专栏精选 引入Mybatis Mybatis的快速入门 Mybatis的增删改查扩展功能说明 mapper映射的参数和结果 Mybatis复杂类型的结果映射 Mybatis基于注解的结果映射 Mybatis枚举类型处理和类型处理器 再谈动态SQL 文章目录 专栏精选引言摘要正文autoMappingBehaviorautoMappingU…

关于设计模式、Java基础面试题

前言 之前为了准备面试,收集整理了一些面试题。 本篇文章更新时间2023年12月27日。 最新的内容可以看我的原文:https://www.yuque.com/wfzx/ninzck/cbf0cxkrr6s1kniv 设计模式 单例共有几种写法? 细分起来就有9种:懒汉&#x…

【中小型企业网络实战案例 四】配置OSPF动态路由协议

【中小型企业网络实战案例 三】配置DHCP动态分配地址-CSDN博客 【中小型企业网络实战案例 二】配置网络互连互通-CSDN博客 【中小型企业网络实战案例 一】规划、需求和基本配置_大小企业网络配置实例-CSDN博客 配置OSPF 由于内网互联使用的是静态路由,在链路出…

第八章 JPA和缓存

1.JPA 1.1.创建User实体类 public class User {private Integer uId;private String uName;private Integer uGender;private Integer uAge;private String uLoginname;private String uPassword;private Date uBirth;private String uEmail;private String uAddress; } 1.2…

走进电子技术之光敏电阻、电位器、开关

同学们大家好,今天我们继续学习杨欣的《电子设计从零开始》,这本书从基本原理出发,知识点遍及无线电通讯、仪器设计、三极管电路、集成电路、传感器、数字电路基础、单片机及应用实例,可以说是全面系统地介绍了电子设计所需的知识…

Redis 是如何执行的?

文章目录 命令执行流程步骤一:用户输入一条命令步骤二:客户端先将命令转换成 Redis 协议,然后再通过 socket 连接发送给服务器端步骤三:服务器端接收到命令步骤四:执行前准备步骤五:执行最终命令&#xff0…

牛客网SQL训练5—SQL大厂真题面试

文章目录 一、某音短视频1.各个视频的平均完播率2.平均播放进度大于60%的视频类别3.每类视频近一个月的转发量/率4.每个创作者每月的涨粉率及截止当前的总粉丝量5.国庆期间每类视频点赞量和转发量6.近一个月发布的视频中热度最高的top3视频 二、用户增长场景(某度信…

idea Spring Boot项目使用JPA创建与数据库链接

1.pom.xml文件中添加依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-jpa</artifactId></dependency><dependency><groupId>com.mysql</groupId><artifactId>…

文章智能改写伪原创方法技巧

哈喽&#xff0c;小伙伴们&#xff0c;大家好&#xff0c;我 又回来了。 今天给大家分享一个文章智能改写原创的方法&#xff0c;现在的自媒体平台&#xff0c;做视频流量挺不好做的&#xff0c;除非你有好的方法&#xff0c;文章呢&#xff0c;就相对比较容易点了&#xff0c;…

Graph Transformer2023最新研究成果汇总,附15篇必看论文

图Transformer是一种结合了Transformer模型和图神经网络&#xff08;GNN&#xff09;的框架&#xff0c;用于在图形结构数据上执行预测任务。在图Transformer中&#xff0c;Transformer的自注意力机制被用来学习节点之间的关系&#xff0c;而GNN则被用来生成节点的嵌入表示。通…

Qt学习:Qt的意义安装Qt

Qt 的简介 QT 是一个跨平台的 C图形用户界面应用程序框架。它为程序开发者提供图形界面所需的所有功能。它是完全面向对象的&#xff0c;很容易扩展&#xff0c;并且允许真正地组件编程。 支持平台 xP 、 Vista、Win7、win8、win2008、win10Windows . Unix/Linux: Ubuntu 等…

一、C++简介

C语言的发展史 1983年&#xff0c;贝尔实验室&#xff08;Bell Labs&#xff09;的Bjarne Stroustrup发明了C。 C在C语言的基础上进行了扩充和完善&#xff0c;是一种面向对象程序设计&#xff08;OOP&#xff09;语言。 Stroustrup说&#xff1a;“这个名字象征着源自于C语言变…

离线AI聊天清华大模型(ChatGLM3)本地搭建

在特定的情况下&#xff0c;要保证信息安全的同时还能享受到AIGC大模型带来的乐趣和功能&#xff0c;那么&#xff0c;离线部署就能帮助到你&#xff0c;最起码&#xff0c;它是一个真正可用的方案。 大模型本身清华的 (ChatGLM3)&#xff0c;为的是对中文支持友好&#xff0c…

爬虫基础一(持续更新)

爬虫概念&#xff1a; 通过编写程序&#xff0c;模拟浏览器上网&#xff0c;然后让其去互联网上抓取数据的过程 分类&#xff1a; 1&#xff0c;通用爬虫&#xff1a;抓取一整张页面数据 2&#xff0c;聚焦爬虫&#xff1a;抓取页面中的局部内容 3&#xff0c;增量式爬虫&…

NFC刷卡soc芯片SI3262集成刷卡+触摸+ACD超低功耗一体

简介 13.56mhz刷卡soc芯片SI3262集成刷卡触摸ACD超低功耗&#xff0c;ACD模式刷卡距离可达到5cm以上&#xff0c;非常适用于小体积门锁&#xff0c;密码锁&#xff0c;柜锁&#xff0c;接下来介绍一下这款芯片的具体功能。 优势 1.超低功耗&#xff0c;最低功耗达 1.7uA&…

【网络安全 | Misc】世安杯 适合作为桌面(Stegsolve及Winhex的使用)

正文 解压后得到图片&#xff1a; 图片属性正常&#xff0c;无特殊点&#xff0c;经测试&#xff0c;无隐写文件&#xff1a; Stegsolve 运行方法&#xff1a; 可以看到出现二维码&#xff1a; 对其解密得到&#xff1a; 03F30D0A79CB05586300000000000000000100000040000000…

【起草】【第六章】ChatGPT 在软件测试的应用场景

6.1 、引言 & 背景 在测试领域&#xff0c;AIGC 的爆发引发了对其在软件测试中的应用可能性的广泛研究和探讨。传统的软件测试方法往往需要大量的人力和时间投入&#xff0c;而 AIGC 技术的引入可能为测试领域带来革命性的变化。AIGC 在测试中的优势在于其高效的自动化能力…

R语言学习笔记-R包的安装

推荐在线安装&#xff0c;可以解决包与包之间的依赖关系。 1.首先在RGui&#xff1a; 2.在RStudio 的console下&#xff1a; 如安装ggplot2包&#xff0c;则&#xff1a; install.packages("ggplot2") 生信方面&#xff1a; 首先安装&#xff1a; install.packa…

HDFS客户端UnknownHostException事故解析

文章目录 前言事故现场问题分析是否是整个域名解析服务当时都出问题了是否是出问题的pods本身的域名解析有问题 异常发生的全部过程域名的解析是什么时候发生的&#xff0c;怎么发生的域名解析的详细流程 重试发生在什么地方为什么重试会无效 Bugfix代码详解关于StandardHostRe…

jenkins解决工具找不到的问题

--------------------------插件选择版本最好能跟服务器对上