【第七章】深度学习思维模式

前言

尽管我们的神经网络表现出令人印象深刻的性能,但这种性能在某种程度上是神秘的。网络中的权重和偏差是自动发现的。这意味着我们并没有立即能够解释网络如何实现其功能。我们能否找到某种方式来理解我们的网络是如何对手写数字进行分类的原则?而且,鉴于这些原则,我们能做得更好吗?

假设几十年后神经网络导致了人工智能(AI)。我们会理解这样的智能网络是如何工作的吗?也许对于我们来说,这些网络将是不透明的,其中的权重和偏差我们不理解,因为它们是自动学习的。在人工智能研究的早期,人们希望建立人工智能的努力也会帮助我们理解智能背后的原则,也许是人类大脑的运作方式。但也许结果将是,我们最终既不理解大脑,也不理解人工智能的工作原理!

思维模式

为了解决这些问题,让我们回顾一下我在本章开头给出的对人工神经元的解释。假设我们想确定一张图像是否显示了一个人脸:
在这里插入图片描述
我们可以像对待手写识别问题一样来解决这个问题——使用图像中的像素作为神经网络的输入,网络的输出是一个单一的神经元,指示“是,这是一张脸”或“不,这不是一张脸”。

假设我们这样做,但我们不使用学习算法。相反,我们要尝试手动设计一个网络,选择适当的权重和偏差。我们应该如何做呢?暂时忘记之前学过的神经网络,我们可以使用的一种启发式方法是将问题分解为子问题:图像左上角是否有眼睛?图像右上角是否有眼睛?中间是否有鼻子?底部中间是否有嘴巴?顶部是否有头发?等等。

如果这些问题的答案中有几个是“是”,甚至只是“可能是”,那么我们会得出结论,该图像很可能是一张脸。相反,如果大多数问题的答案是“否”,那么该图像很可能不是一张脸。

当然,这只是一个粗略的启发式方法,它有许多缺陷。也许这个人是秃头,所以他们没有头发。也许我们只能看到脸的一部分,或者脸是倾斜的,所以一些面部特征被遮挡了。尽管如此,这个启发式方法表明,如果我们可以使用神经网络解决这些子问题,那么也许我们可以通过组合这些子问题的网络来构建一个用于人脸检测的神经网络。以下是一个可能的架构,其中矩形表示子网络。请注意,这并不是解决人脸检测问题的现实方法;相反,它是为了帮助我们建立对网络功能的直觉。以下是架构:

请添加图片描述
有可能子网络可以进行分解。假设我们正在考虑这个问题:“左上角有眼睛吗?” 这可以分解成诸如:“有眉毛吗?”;“有睫毛吗?”;“有虹膜吗?”等问题。当然,这些问题实际上应该包括位置信息,“眉毛在左上方,虹膜上方吗?”之类的内容,但我们保持简单。现在,用来回答“左上角有眼睛吗?”这个问题的网络可以分解为:

请添加图片描述
这些问题也可以进一步分解,通过多个层次进行。最终,我们将使用回答问题的子网络,这些问题简单到可以轻松地在单个像素级别上回答。例如,这些问题可能是关于图像中特定点处非常简单的形状的存在或缺失。这样的问题可以由连接到图像中原始像素的单个神经元来回答。

最终结果是一个网络,将一个非常复杂的问题——这张图片是否显示了一张脸——分解成可以在单个像素级别回答的非常简单的问题。它通过一系列许多层次来实现,早期的层次回答关于输入图像的非常简单和具体的问题,而后期的层次则构建起了越来越复杂和抽象的概念的层次结构。具有这种多层结构(两个或更多隐藏层)的网络被称为深度神经网络。

当然,我还没有说明如何进行这种对子网络的递归分解。手动设计网络中的权重和偏差显然是不切实际的。相反,我们希望使用学习算法,让网络可以从训练数据中自动学习权重和偏差,从而形成概念的层次结构。20世纪80年代和90年代的研究人员尝试使用随机梯度下降和反向传播来训练深层网络。不幸的是,除了一些特殊的架构之外,他们并没有取得太大成功。网络会学习,但学习速度很慢,实际上往往太慢以至于无法使用。

从2006年开始,一套技术已经被开发出来,使深度神经网络能够进行学习。这些深度学习技术基于随机梯度下降和反向传播,但也引入了新的思想。这些技术使得能够训练更深(和更大)的网络——现在人们经常训练具有5到10个隐藏层的网络。而且,事实证明,在许多问题上,这些网络表现得比浅层神经网络(即只有一个隐藏层的网络)要好得多。当然,原因在于深度网络能够构建起复杂的概念层次结构。这有点像传统编程语言使用模块化设计和抽象概念来实现复杂计算机程序的创建。将深层网络与浅层网络进行比较,有点像将具有函数调用能力的编程语言与没有这种能力的简化语言进行比较。在神经网络中,抽象形式与传统编程中的不同,但同样重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2869822.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

高中数学:复杂函数图像的草图画法(较难)

一、三大基本函数图像 1、指数函数图像 2、对数函数图像 3、幂函数图像 二、案例 口诀:上加下减,左加右减 1、指数函数图像变化规律 2、带绝对值的函数图像 情况1:绝对值套住整个函数表达式 画法原则:x轴下方的图像&#xff0…

【计算机组成原理】处理机管理

目录 一、处理机分类 1. MPU 2. MCU 3. DSP 二、CPU的功能 1. 指令控制 2. 操作控制 3. 时间控制 4. 数据加工 三、CPU的组成 (一)控制器 1. 控制器的功能 (1)控制指令执行的顺序 ① 程序中规定的转移类型指令 ② …

Nacos与Eureka的使用与区别

Nacos与Eureka的使用与区别 单体架构:优点缺点 分布式架构需要考虑的问题:微服务企业需求 认识SpringCloud服务的拆分与远程调用微服务调用方式 Eureka提供者和消费者架构搭建Eureka服务注册服务发现 Ribbon负载均衡饥饿加载总结 Nacos注册中心Nacos安装…

前端React篇之React的生命周期有哪些?

目录 React的生命周期有哪些?挂载阶段(Mounting)更新阶段(Updating)卸载阶段(Unmounting)错误处理阶段(Error Handling) React常见的生命周期React主要生命周期 React的生…

【List集合】List接口源码解读一(ArrayList)

目录 前言 1. List接口的基本信息 2. ArrayList 2.1.ArrayList 的基本信息 2.2. ArrayList 的构造方法 2.2.1 ArrayList 的构造方法一 2.2.2 ArrayList 的构造方法二 2.2.3 ArrayList 的构造方法三 2.3 ArrayList 的扩容方式 总结 前言 Java 语言由于其跨平台、社区良…

微信小程序开发系列(三十四)·自定义组件的创建、注册以及使用(数据和方法事件的使用)

目录 1. 分类和简介 2. 公共组件 2.1 创建 2.2 注册 2.3 使用 3. 页面组件 3.1 创建 3.2 注册 3.3 使用 4. 组件的数据和方法的使用 4.1 组件数据的修改 4.2 方法事件的使用 1. 分类和简介 小程序目前已经支持组件化开发,可以将页面中的功能…

Three 材质纹理 (总结三)

THREE.MeshLambertMaterial(网格 Lambert 材质) 该材质使用基于非物理的Lambertian模型来计算反射率。可以用来创建暗淡的并不光亮的表面,该材质非常易用,而且会与场景中的光源产生反应。 MeshLambertMaterial属性 # .color : …

24年上半年英语四六级报名时间25地汇总一览表

目前有25地公布了报名时间,大多集中在3月中下旬,具体时间以学校通知为准。 7个省份官宣 • 贵州(官方):3月18日12:00-3月29日16:00 • 黑龙江(官方):3月18日14:00-3月29日17:00 • 江西(官方):3月19日6:00-3月25日17:0…

05.BOM对象

一、js组成 JavaScript的组成 ECMAScript: 规定了js基础语法核心知识。比如:变量、分支语句、循环语句、对象等等 Web APIs : DOM 文档对象模型, 定义了一套操作HTML文档的APIBOM 浏览器对象模型,定义了一套操作浏览器窗口的API 二、windo…

deepseek-coder模型量化

1 简介 DeepSeek-Coder在多种编程语言和各种基准测试中取得了开源代码模型中最先进的性能。 为尝试在开发板进行部署,首先利用llama.cpp对其进行量化。 2 llama.cpp安装 git clone之后进入文件夹make即可,再将依赖补全pip install -r requirements.tx…

【Miniconda】基于conda避免运行多个PyTorch项目时发生版本冲突

【Miniconda】基于conda避免运行多个PyTorch项目时发生版本冲突 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希望得到…

原创 《vtk9 book》 官方web版 第四章 - 可视化管线(1 / 2)

在前一章中,我们使用简单的数学模型创建了图形图像,用于光照、视图和几何。光照模型包括环境光、漫反射和镜面效果。视图包括透视和投影的效果。几何被定义为一组静态的图形原语,如点和多边形。为了描述可视化过程,我们需要扩展我…

读算法的陷阱:超级平台、算法垄断与场景欺骗笔记12_移动平台(上)

1. 广告 1.1. 广告收入的来源 1.1.1. 向客户推荐广告投放网址 1.1.2. 提供有效提高产品广告点击率的咨询服务 1.1.3. 从合作伙伴的广告收入中捞上一笔 1.2. 对于广告主来讲,他们无意于与各家网站逐一谈判 1.2.1. 这种方式一是成本过高,二是费时费力…

Github 2024-03-17 php开源项目日报 Top9

根据Github Trendings的统计,今日(2024-03-17统计)共有9个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量PHP项目9Blade项目2Laravel:表达力和优雅的 Web 应用程序框架 创建周期:4631 天开发语言:PHP, BladeStar数量:75969 个Fork数量:24281 次关…

Delphi7应用教程学习1.3【练习题目】:文本及悬停文字的显示

这个例子主要用到了btn的Hint 属性,Hint是提示的意思。 还有Delphi7还是很好用的,改变了的属性是粗体,默认没有改变的属性为细体。

力扣新思路题:字符串轮转

非常简单的思路:将两个字符串s1接起来,并判断s2字符串是否是加长版s1字符串的子串 bool isFlipedString(char* s1, char* s2){if (strlen(s1) ! strlen(s2)) {return false;}int len strlen(s1);int i 0;char* arr (char*)malloc(sizeof(char) * len…

深入理解RAG:检索与生成的融合

原文地址:https://dev.to/portkey/understanding-rag-a-deeper-dive-into-the-fusion-of-retrieval-and-generation-1l4b 深入理解RAG:检索与生成的融合 检索增强生成(RAG)模型代表了检索系统和生成模型两大不同但互补组件完美结合的杰作。通过无缝集成相关信息检…

(x+2y+3z+4w)^4展开式经过合并同类项之后,xyzw的系数为?

求的展开式经过合并同类项之后,的系数 根据二项式定理,的系数为:

HarmonyOS NEXT应用开发—视频全屏切换案例

介绍 本示例介绍了Video组件和ohos.window接口实现媒体全屏的功能。 该场景多用于首页瀑布流媒体播放等。 效果图预览 使用说明: 点击全屏按钮,横屏媒体窗口。点击恢复窗口按钮,恢复媒体窗口。 实现步骤 在Video组件内调用 onFullscreen…

ARM 汇编指令:(七) STM/LDM多寄存器加载/多存储指令

目录 一.四种栈 1.满增栈:进栈(先移动指针再入栈,指针往地址增大的方向移动);出 栈(先出栈,栈指针往地址减小的地方移动)。 2.满减栈:进栈(先移动指针再入…