《Python深度学习》阅读笔记

以下是《Python深度学习》一书中学习过程中记录的一些重要的专属名词和概念:

一、概念

  1. 深度学习(Deep Learning):指使用多层神经网络进行机器学习的技术。
  2. 神经网络(Neural Network):一种模仿生物神经网络工作原理的机器学习模型。
  3. 前向传播(Forward Propagation):在神经网络中,输入数据从输入层通过隐藏层,最终到达输出层的过程。
  4. 反向传播(Backpropagation):在神经网络中,根据输出层的错误来调整网络中权重的过程。
  5. 激活函数(Activation Function):用于引入非线性特性到神经网络中的函数,如ReLU、Sigmoid和Tanh等。
  6. 批量标准化(Batch Normalization):一种加速神经网络训练的方法,通过对每一批数据进行归一化处理来改善网络的性能。
  7. 损失函数(Loss Function):用于衡量模型预测结果与真实结果之间的差距。
  8. 优化器(Optimizer):用于调整模型中的权重和偏置,以最小化损失函数。
  9. 学习率(Learning Rate):优化器在调整权重和偏置时的步长。
  10. Dropout(Dropout):一种正则化技术,通过随机忽略部分神经元来防止过拟合。
  11. 过拟合(Overfitting):模型在训练数据上表现很好,但在测试数据上表现不佳的现象。
  12. 欠拟合(Underfitting):模型在训练数据和测试数据上都表现不佳的现象。
  13. 卷积神经网络(Convolutional Neural Network,CNN):一种专门用于处理图像数据的神经网络。
  14. 循环神经网络(Recurrent Neural Network,RNN):一种能够处理序列数据的神经网络,如文本和时间序列数据。
  15. 长短期记忆网络(Long Short-Term Memory,LSTM):一种特殊的循环神经网络,用于处理需要理解序列中长距离依赖关系的问题。
  16. 转化器(Transformer):一种基于自注意力机制的深度学习模型,被广泛应用于自然语言处理任务。
  17. 自注意力机制(Self-Attention Mechanism):一种让神经网络关注输入序列中不同位置的信息,从而更好地理解序列数据的技术。
  18. 验证集(Validation Set):从原始数据中划分出来的一组数据,用于调整模型的超参数和防止过拟合。
  19. 测试集(Test Set):从原始数据中划分出来的一组数据,用于评估模型的性能。
  20. 梯度消失问题(Vanishing Gradient Problem):在深度神经网络中,梯度在反向传播过程中会逐渐变小,导致网络中的早期层无法从训练过程中学习到有用的信息。
  21. 梯度爆炸问题(Exploding Gradient Problem):与梯度消失问题相反,梯度在反向传播过程中可能会变得非常大,导致模型训练不稳定甚至崩溃。
  22. 特征工程(Feature Engineering):通过对数据进行预处理、转换和特征选择等操作,提高机器学习模型性能的过程。
  23. 迁移学习(Transfer Learning):利用在大规模数据集上预训练的模型来帮助解决类似问题的技术。
  24. Keras:一个高级神经网络API,支持多种深度学习框架,包括TensorFlow、CNTK和Theano等。
  25. TensorFlow:一个流行的深度学习框架,由Google开发并维护。
  26. PyTorch:另一个流行的深度学习框架,由Facebook AI Research开发并维护。
  27. Keract:Keras的CPU和GPU张量操作库,提供更高效的张量操作功能。
  28. Jupyter Notebook:一个Web应用程序,允许创建和共享包含实时代码、注释和输出在内的文档。
  29. Colab:Google开发的免费Jupyter notebook服务,提供GPU加速功能。
  30. Docker:一个开源容器化平台,允许打包、分发和运行应用程序及其依赖项。
  31. TensorBoard:TensorFlow的可视化工具,用于监视训练过程、可视化和理解模型。
  32. ONNX:开放神经网络交换格式,用于表示深度学习模型。它支持多种深度学习框架的模型转换,包括TensorFlow、PyTorch和其他框架。
  33. NVIDIA GPU:专为深度学习应用设计的图形处理器,提供强大的计算能力和高内存带宽。
  34. TPU(Tensor Processing Unit):Google专为机器学习任务设计的处理器,具有高吞吐量、低延迟和节能等特性。
  35. GPU Cloud Provider:提供GPU云服务以支持深度学习应用的云服务提供商,如Google Cloud、Amazon Web Services(AWS)和Microsoft Azure等。
  36. OpenAI API:OpenAI是一家提供人工智能模型的机构,其API允许用户通过简单的接口访问其强大的深度学习模型。
  37. GPT(Generative Pre-trained Transformer):一种基于Transformer模型的自回归语言模型,被用于生成文本和回答自然语言问题。
  38. BERT(Bidirectional Encoder Representations from Transformers):一种基于Transformer模型的预训练语言模型,被用于理解自然语言文本的含义和上下文。
  39. Transformer模型:一种基于自注意力机制的深度学习模型,被广泛应用于自然语言处理任务。
  40. 自动编码器(Autoencoder):一种神经网络架构,用于将输入数据编码成低维空间表示,然后再从低维空间表示还原成原始数据。
  41. 生成对抗网络(Generative Adversarial Networks,GAN):一种神经网络架构,由一个生成器网络和一个判别器网络组成,通过竞争来提高双方的生成和判别能力。
  42. 变分自编码器(Variational Autoencoder,VAE):一种结合了潜变量模型的神经网络架构,用于生成数据和重构数据。
  43. 强化学习(Reinforcement Learning):一种通过与环境的交互来学习最优行为的机器学习方法。
  44. Q-Learning:一种用于解决强化学习问题的算法,通过学习动作的价值来选择最优动作。
  45. TensorFlow Serving:TensorFlow的模型部署框架,用于将训练好的模型转换成服务部署到生产环境。
  46. TensorFlow Lite:TensorFlow的移动端和嵌入式设备支持框架,用于在这些设备上运行TensorFlow模型。
  47. TensorFlow.js:TensorFlow的JavaScript库,用于在浏览器和Node.js环境中运行TensorFlow模型。
  48. TensorBoardX:使用TensorFlow 1.x API的TensorBoard替代方案,支持Keras 2.x和PyTorch。
  49. ONNX Runtime:ONNX的模型运行时,支持在多种设备上运行ONNX格式的模型。

二、详解

2.1 深度学习

在这里插入图片描述

深度学习是机器学习的一个分支领域:它是从数据中学习表示的一种新方法,强调从连续的层中学习,这些层对应于越来越有意义的表示。

深度学习之“深度”并不是说这种方法能够获取更深层次的理解,而是指一系列连续的表示层。数据模型所包含的层数被称为该模型的深度( depth)。

2.2 神经网络

在深度学习中,这些分层表示是通过叫作神经网络( neural network)的模型学习得到的。
神经网络的结构是逐层堆叠。“神经网络”这一术语来自于神经生物学,然而,虽然深度学习的
一些核心概念是从人们对大脑(特别是视觉皮层)的理解中汲取部分灵感而形成的,但深度学
习模型并不是大脑模型。没有证据表明大脑的学习机制与现代深度学习模型的学习机制相同。
你可能读过一些科普文章,这些文章宣称深度学习的工作原理与大脑相似或者是在模拟大脑,
但事实并非如此。对于这一领域的新人来说,如果认为深度学习与神经生物学存在任何关系,
那将使人困惑,只会起到反作用。

2.3 前向传播

在这里插入图片描述

我们为图中的“输入节点”(输入 x、目标 y_true、 w 和 b)赋值。我们将这些值传入图中
所有节点,从上到下,直到 loss_val。这就是前向传播过程

2.4 反向传播

在这里插入图片描述

下面我们“反过来”看这张图。对于图中从 A 到 B 的每条边,我们都画一条从 B 到 A 的反向边,
并提出问题:如果 A 发生变化,那么 B 会怎么变?也就是说, grad(B, A) 是多少?我们在每
条反向边上标出这个值。这个反向图表示的是反向传播过程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2868426.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

【Algorithms 4】算法(第4版)学习笔记 18 - 4.4 最短路径

文章目录 前言参考目录学习笔记0:引入介绍1:APIs1.1:API:加权有向边1.2:Java 实现:加权有向边1.3:API:加权有向图1.4:Java 实现:加权有向图1.5:AP…

【C语言】分支语句(逻辑运算符与关系运算符)

文章目录 **逻辑运算符(&&、||、!)**逻辑运算符特点短路短路-逻辑与短路-逻辑或 **关系运算符(relational expression)**运算操作符的结合律、运算符 **选择结构/分支结构****if 语句****复合句的if语句(if...else..语句)****不良风格的程序** *…

力扣hot100:416.分割等和子集(组合/动态规划/STL问题)

组合数问题 我们思考一下,如果要把数组分割成两个子集,并且两个子集的元素和相等,是否等价于在数组中寻找若干个数使之和等于所有数的一半?是的! 因此我们可以想到,两种方式: ①回溯的方式找到t…

DC-DC电源管理芯片MC34063A介绍

MC34063A 为一单片 DC-DC 变换集成电路,内含温度补偿的参考电压源(1.25V)、比较器、能有效限制电流及控制工作周期的振荡器,驱动器及大电流输出开关管等。外配少量元件,就能组成升压、降压及电压反转型 DC-DC 变换器。…

计算机系统基础 2 Intel 中央处理器

Intel微处理器的发展史 INTegrated ELectronics(集成电子)的缩写 先后推出的中央处理器: Intel4004、Intel8008、Intel8080/8085、8086/8088、80186、80286、i386、i486 Pentium(奔腾)、Pentium II、Pentium III、Pen…

Android Studio实现内容丰富的安卓宠物用品商店管理系统

获取源码请点击文章末尾QQ名片联系,源码不免费,尊重创作,尊重劳动。 项目编号128 1.开发环境android stuido jdk1.8 eclipse mysql tomcat 2.功能介绍 安卓端: 1.注册登录 2.系统公告 3.宠物社区(可发布宠物帖子&#…

php中 0 == ‘’(0等于任意字符串) 判断是否成立 返回true

php中不同类型变量之间比较大小 一、背景二、探究0是为什么?三、探究 0all是为什么?四、程序中如何判断0是否等于指定字符串 一、背景 最近在项目实际开发中,我需要判断前端传来的参数值是否等于一个字符串;然后发现当参数值是0时…

论文阅读——ViTAE

ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias ViTAE旨在将细胞神经网络中固有的IB引入视觉转换器。如图2所示,ViTAE由两种类型的细胞组成,即RC和NC。RC负责将多尺度上下文和局部信息嵌入到令牌中,NC用于进一步…

XXE漏洞原理和pikachu靶场实验

★★免责声明★★ 文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与学习之用,读者将信息做其他用途,由Ta承担全部法律及连带责任,文章作者不承担任何法律及连带责任。 1、XXE漏洞原理 XXE全称:XML External Enti…

JUnit 面试题及答案整理,最新面试题

JUnit中的断言(Assert)有哪些类型? JUnit提供了多种断言类型来帮助测试代码的正确性。常见的断言类型包括: 1、assertEquals: 用于检查两个值是否相等。如果不相等,测试失败。 2、assertTrue和assertFal…

HarmonyOS NEXT应用开发—折叠屏音乐播放器方案

介绍 本示例介绍使用ArkUI中的容器组件FolderStack在折叠屏设备中实现音乐播放器场景。 效果图预览 使用说明 播放器预加载了歌曲,支持播放、暂停、重新播放,在折叠屏上,支持横屏悬停态下的组件自适应动态变更。 实现思路 采用MVVM模式进…

【消息队列开发】 实现消息垃圾回收

文章目录 🍃前言🎋准备工作🎍具体实现🚩创建一个新文件🚩读取有效对象🚩把有效消息写入新文件中🚩以旧换新🚩更新统计文件🚩特别注意🚩完整代码 ⭕总结 &…

2.1_5 数据交换方式

文章目录 2.1_5 数据交换方式(一)为什么要数据交换?(二)数据交换方式(1)电路交换(Circuit Exchanging)(2)报文交换(Message Exchangin…

mybatis源码阅读系列(二)

前言 上一篇文章mybatis源码阅读系列(一)介绍了mybatis和原生jdbc的区别,并通过代码展示了两者的运行过程和结果,下面让我们继续详细了解下mybatis的执行过程; package com.wyl.mybatis.service;import com.wyl.mybat…

环形链表2(C++), test ok

1. 题目 2. 思路分析: 与环形链表1一样,我们需要定义慢指针和快指针,确定链表是否有环,如果链表没有环的话,直接置空即可。如果链表有环,则需要向环形链表1一样,让快指针不断追赶慢指针&#x…

NVENC 视频编码器 API 编程指南 ( 中文转译 )

基于 NVIDIA Kepler™ 和更高版本 GPU 架构的 NVIDIA GPU 包含基于硬件的 H.264/HEVC/AV1 视频编码器(以下简称 NVENC)。NVENC 硬件采用 YUV/RGB 作为输入,并生成符合H.264/HEVC/AV1 标准的视频比特流。可以使用 NVIDIA 视频编解码器 SDK 中提…

Learn OpenGL 15 面剔除

面剔除 尝试在脑子中想象一个3D立方体,数数你从任意方向最多能同时看到几个面。如果你的想象力不是过于丰富了,你应该能得出最大的面数是3。你可以从任意位置和任意方向看向这个球体,但你永远不能看到3个以上的面。所以我们为什么要浪费时间…

Avalonia学习1:下载通用皮肤SukiUI,并在windows上启动成功

目录 1、引言 2、碰到的问题 1、下载下拉VS2022老版本的用不了。 2、升级后,发现没有装wsl,导致启动不了,但wsl又由于国内的关系安装不了,怎么办呢, 1、引言 最近在想有没有什么可以开发在Linux下运行…

公众号留言功能恢复了,你的开通了吗?

了解公众号的人都知道,腾讯在2018年3月宣布暂停新注册公众号的留言功能,这之后注册的公众号都不具备留言功能。 这成了很多号主运营人的一块心病,也包括我。 没有留言,就好似一个人玩单机游戏,无法与读者互动&#xff…

一文总结python的异常数据处理示例

AI应用开发相关目录 本专栏包括AI应用开发相关内容分享,包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧 适用于具备一定算法及Python使用基础的人群 AI应用开发流程概…