吴恩达deeplearning.ai:Tensorflow训练一个神经网络

以下内容有任何不理解可以翻看我之前的博客哦:吴恩达deeplearning.ai
在之前的博客中。我们陆续学习了各个方面的有关深度学习的内容,今天可以从头开始训练一个神经网络了。

Tensorflow训练神经网络模型

我们使用之前用过的例子:
在这里插入图片描述
这个神经网络有三层,第一层拥有25个神经元,第二层15个神经元,第三层为最终输出层。
现在提供一个训练集X,一个标签Y,该如何通过代码的形式来表现呢?

#1导入工具包
import tensrflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense#2创建三个层并让Tensorflow按照顺序将几个层串联起来model = Sequential([Dense(units = 25, activation = 'sigmoid')Dense(units = 15, activation = 'sigmoid')Dense(units = 1, activation = 'sigmoid')])#3引入工具包,并且让损失函数使用分类交叉熵的形式
from tensorflow.keras.losses import
BinaryCrossentropymodel.compile(loss = BinaryCrossentropy())#调用拟合函数,epoch代表训练次数model.fit(X, Y, epochs=100)

模型中的一些细节讲解

框架相关

让我们先复习一下之前的内容,如何实现逻辑回归的:
第一步,如何在给定输入特征X和参数W,b的情况下计算输出(定义模型),我们这里经常使用的是sigmoid函数。
第二步,指定损失函数与成本函数
第三步,训练模型,最小化J(w,b)
让我们在训练神经网络的背景下来看看这几步:

#1导入工具包
import tensrflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense#2创建三个层并让Tensorflow按照顺序将几个层串联起来model = Sequential([Dense(units = 25, activation = 'sigmoid')Dense(units = 15, activation = 'sigmoid')Dense(units = 1, activation = 'sigmoid')])

这几段代码说明了神经网络的整个架构体系,告诉你第一层有25个神经元,第二层有15个神经元,第三层一个,采用的激活函数均为sigmoid。

损失函数相关

再写一遍 损失函数的一般数学表达式:
J ( W , B ) = 1 m ∑ L ( f ( x ( i ) , y ( i ) ) J(W,B) = \frac{1}{m}\sum L(f(x^{(i)},y^{(i)}) J(W,B)=m1L(fx(i),y(i))

 #3引入工具包,并且让损失函数使用分类交叉熵的形式
from tensorflow.keras.losses import
BinaryCrossentropymodel.compile(loss = BinaryCrossentropy())

这个名叫keras的工具包其实是和tensorflow是完全不同的两个项目开发的,只是最后合入了tensorflow,所有它的工具包需要你单独import。另外,由于工具包的种类真的很多,所以不知道工具包的名字和使用方法时可以上网查找哦。
我们在之前的博客中,曾经学习过二元交叉熵(这是统计学上的叫法),二元的意思是说明这是个布尔值,要么为1要么为0.只是在之前的博客中不叫这个名字,而是为了能够在一个式子之中写出价代价函数:
L ( f ( x ) , y ) = − y l o g ( f ( x ) ) − ( 1 − y ) l o g ( ( 1 − f ( x ) ) L(f(x),y) = -ylog(f(x)) - (1-y)log((1-f(x)) L(f(x),y)=ylog(f(x))(1y)log((1f(x))
在制定了损失函数之后,Tensorflow就知道了你是希望最小化m个训练的平均值。
如果你是想解决其它类型的问题例如回归问题,你可以给tensorflow指定其它种类的损失函数:

from tensorflow.keras.losses import MeanSquareError
model.compile(loss = MeanSquareError())

这是最小化平方误差损失的损失函数。

梯度下降

梯度下降时,你需要重复公式:
w = w − α ∂ ∂ w j J ( w , b ) b = b − α ∂ ∂ b j J ( w , b ) w = w - \alpha\frac{\partial}{\partial w_j}J(w,b)\\ b = b - \alpha\frac{\partial}{\partial b_j}J(w,b) w=wαwjJ(w,b)b=bαbjJ(w,b)

#调用拟合函数,epoch代表训练次数model.fit(X, Y, epochs=100)

Tensorflow使用的是一种叫做反向传播的算法来计算这些偏导数项,只是在函数model.fit中完成的,并告诉它这样迭代100次。

很明显我们现在的代码严重依赖于Tensorflow库,随着技术的发展,大部分工程师都会使用库而非自己重头编起。现在你已经了解了如何自己训练一个神经网络了,在接下来的博客中我们讲讲到一些你可以改变的地方,使得你的神经网络更加强大。
为了给读者你造成不必要的麻烦,博主的所有视频都没开仅粉丝可见,如果想要阅读我的其他博客,可以点个小小的关注哦。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2808084.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

SSM项目集成Spring Security 4.X版本 之 加入DWZ,J-UI框架实现登录和主页菜单显示

目录 前言 一、加入DWZ J-UI框架 二、实现登录页面 三、实现主页面菜单显示 前言 大家好!写文章之前先列出几篇相关文章。本文内容也在其项目中接续实现。 一. SSM项目集成Spring Security 4.X版本(使用spring-security.xml 配置文件方式&#xff…

HDL FPGA 学习 - Quartus II 工程搭建,ModelSim 仿真,时序分析,IP 核使用,Nios II 软核使用,更多技巧和规范总结

目录 工程搭建、仿真与时钟约束 一点技巧 ModelSim 仿真 Timing Analyzer 时钟信号约束 SignalTap II 使用 In-System Memory Content Editor 使用 记录 QII 的 IP 核使用 记录 Qsys/Nios II 相关 记录 Qsys 的 IP 核使用 封装 Avalon IP 更多小技巧教程文章 更多好…

TF-IDF,textRank,LSI_LDA 关键词提取

目录 任务 代码 keywordExtract.py TF_IDF.py LSI_LDA.py 结果 任务 用这三种方法提取关键词,代码目录如下, keywordExtract.py 为运行主程序 corpus.txt 为现有数据文档 其他文件,停用词,方法文件 corpus.txt 可以自己…

手把手教你,设置IDEA实现SSH远程连接Linux服务器

前言 工作中,偶尔会遇到需要连接远程Linux环境进行开发。这篇文章就介绍一下如何在IDEA中设置远程连接服务器开发环境,并结合Cpolar内网穿透工具实现无公网远程连接,实现远程开发。 IDEA的远程开发功能,可以将本地的编译、构建、…

神经网络系列---常用梯度下降算法

文章目录 常用梯度下降算法随机梯度下降(Stochastic Gradient Descent,SGD):随机梯度下降数学公式:代码演示 批量梯度下降(Batch Gradient Descent)批量梯度下降数学公式:代码演示 小…

【监督学习之逻辑回归】

曾梦想执剑走天涯,我是程序猿【AK】 目录 简述概要知识图谱1.什么是逻辑回归?2.逻辑回归有哪些应用?3.回归分析如何工作?4.逻辑回归模型如何工作?5.逻辑回归分析有哪些类型?6.逻辑回归与其他机器学习技术相…

网络编程、UDP、TCP

计算机网络 就是将地理位置不同的具有独立功能的多台计算及外部设备,通过通信线路连接起来,在网络操作系统、网络管理软件以及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统 目的 传播交流信息、数据交换、通信 如何做…

算法分析-面试1-字符串

文章目录 前言一、分类:看看就行了二、字符串API:创建和初始化:查询操作:比较操作:修改操作:截取操作:分割操作:格式化操作:连接操作(Java 8 及以后&#xff…

给大家分享一款小程序:AI一秒修图

AI一秒修图 照片修复的AI助手特点:Demo(1.选择图片 2.涂抹遮罩 3.消除)Product Roadmap (版本演进)Contact-联系我们Reference 照片修复的AI助手 照片修复小小助手是一款快速P图微信小程序,用来消除图片中指定的人和物&#xff…

人工智能绘画的时代下到底是谁在主导,是人类的想象力,还是AI的创造力?

#ai作画 目录 一.AI绘画的概念 1. 数据集准备: 2. 模型训练: 3. 生成绘画: 二.AI绘画的应用领域 三.AI绘画的发展 四.AI绘画背后的技术剖析 1.AI绘画的底层原理 2.主流模型的发展趋势 2.1VAE — 伊始之门 2.2GAN 2.2.1GAN相较于…

软考43-上午题-【数据库】-关系代数转SQL语言

一、投影转SQL语言-select 示例: 二、选择转SQL语言-where 示例: 【注意】: 关系代数公式的写法,可以写属性名,也可以写列的序号,如: 但是,SQL语言不支持!!&a…

软件设计师软考题目解析05 --每日五题

想说的话:要准备软考了。0.0,其实我是不想考的,但是吧,由于本人已经学完所有知识了,只是被学校的课程给锁在那里了,不然早找工作去了。寻思着反正也无聊,就考个证玩玩。 本人github地址&#xf…

H5多用途的产品介绍展示单页HTML5静态网页模板

H5多用途的产品介绍展示单页HTML5静态网页模板 源码介绍:一款H5自适应多用途的产品介绍展示单页HTML静态网页模板,可用于团队官网、产品官网。 下载地址: https://www.changyouzuhao.cn/13534.html

作业 找单身狗2

方法一: 思路: 我们可以先创建一个新的数组,初始化为0,然后让原来的数组里面的元素作为新数组的下标 如果该下标对应的值为0,说明没有出现过该数,赋值为1作为标记,表示出现过1次 如果该下标…

掌握BeautifulSoup4:爬虫解析器的基础与实战【第91篇—BeautifulSoup4】

掌握BeautifulSoup4:爬虫解析器的基础与实战 网络上的信息浩如烟海,而爬虫技术正是帮助我们从中获取有用信息的重要工具。在爬虫过程中,解析HTML页面是一个关键步骤,而BeautifulSoup4正是一款功能强大的解析器,能够轻…

Java8 Stream API 详解:流式编程进行数据处理

🏷️个人主页:牵着猫散步的鼠鼠 🏷️系列专栏:Java全栈-专栏 🏷️个人学习笔记,若有缺误,欢迎评论区指正 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默&…

Go语言必知必会100问题-03 滥用init函数

滥用init函数 在Go语言中,滥用init函数会导致难以理解的代码流和槽糕的错误处理。本文将对init函数进行一个梳理,什么是init函数以及推荐的使用场景。 init函数 init函数是一个不带参数并且无返回结果的函数(func()函数)。初始…

[云原生] 二进制安装K8S(上)搭建单机matser、etcd集群和node节点

一、单机matser预部署设计 目前Kubernetes最新版本是v1.25,但大部分公司一般不会使用最新版本。 目前公司使用比较多的:老版本是v1.15,因为v1.16改变了很多API接口版本,国内目前使用比较多的是v1.18、v1.20。 组件部署&#xff…

【Linux】部署单机项目(自动化启动)

目录 一.jdk安装 二.tomcat安装 三.MySQL安装 四.部署项目 一.jdk安装 1.上传jdk安装包 jdk-8u151-linux-x64.tar.gz 进入opt目录,将安装包拖进去 2.解压安装包 防止后面单个系列解压操作,我这边就直接将所有的要用的全部给解压,如下图注…

Chiplet技术与汽车芯片(二)

目录 1.回顾 2.Chiplet的优势 2.1 提升芯片良率、降本增效 2.2 设计灵活,降低设计成本 2.3 标准实行,构建生态 3.Chiplet如何上车 1.回顾 上一篇,我们将来芯粒到底是什么东西,本篇我们来看芯粒技术的优势,以及它…