跟李沐学AI:模型选择、过拟合和欠拟合

目录

训练误差和泛化误差

验证数据集和测试数据集

K-则交叉验证

模型总结

过拟合和欠拟合

模型容量

模型容量的影响

估计模型容量 

数据复杂度

拟合总结


训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差

我们更加关心泛化误差

验证数据集和测试数据集

验证数据集:一个用来评估模型好坏的数据集,不参加训练,用于验证参数的好坏。一定不能跟训练数据混在一起。

测试数据集:只用一次的数据集。不能根据测试数据集的结果重新调整模型参数。

K-则交叉验证

现实训练中常常会出现数据不够的情况。如100个样本,50个做训练数据集,50个做验证数据集,太过浪费。可以使用K-则交叉验证算法解决。

拿到数据集后,随机打乱并将数据集分割成K块。

随后,做K次计算。将第i块数据集作为验证数据集,其余作为训练数据集。

最后,对K次的误差指取平均,作为模型的误差。

常用的K值为5或10

模型总结

训练数据集用于训练模型参数

验证数据集用于选择模型超参数

非大数据集可以使用k-则交叉验证进行训练

过拟合和欠拟合

模型容量

指拟合各种函数的能力。低容量的模型难以拟合所有数据。高容量的模型可以记住所有训练数据。

模型容量的影响

当模型容量较低时,误差较大。因为模型无法很好的拟合数据。模型容量逐渐增加时,训练误差不断降低,泛化误差达到最小值后逐渐上升。这是因为模型容量过大时,模型过于关注细节,被无关细节所误导。泛化误差与训练误差的差值常用于衡量模型拟合的程度。

模型训练核心任务:泛化误差降低、泛化误差与训练误差差值降低。

深度学习允许模型有一定过拟合。

估计模型容量 

给定一个模型种类,通过控制参数的个数和参数值的选择范围以控制模型的容量。

数据复杂度

数据复杂度受多个因素影响:样本个数、每个样本的元素个数、时间、空间结构、多样性(类别)

拟合总结

模型容量需要匹配数据复杂度,否则可能导致欠拟合和过拟合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3246655.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

我无法给博客园出钱,那我就出点建议吧

相信这张图大家都已经看见过了,从去年就传出博客园经营困难的情况,其实很多平台,不止是博客园,包括现在国内的很多公司都一样,经营是一件大难题,但很多公司我们不知道,悄无声息的倒下了。而博客…

泛微e-cology WorkflowServiceXml SQL注入漏洞(POC)

漏洞描述: 泛微 e-cology 是泛微公司开发的协同管理应用平台。泛微 e-cology v10.64.1的/services/接口默认对内网暴露,用于服务调用,未经身份认证的攻击者可向 /services/WorkflowServiceXml 接口发送恶意的SOAP请求进行SQL注入,…

Nginx优化与防盗链(企业网站架构部署与优化)

Nginx网页优化与防盗链 本章结构 隐藏版本号: 首先进入nginx的配置文件: vim /usr/local/nginx/conf/nginx.conf 添加这个语句,重启服务后生效。 重启服务后生效; 如果想把nginx名称都给改了,需要修改nginx的源代码…

STM32使用Wifi连接阿里云

目录 1 实现功能 2 器件 3 AT指令 4 阿里云配置 4.1 打开阿里云 4.2 创建产品 4.3 添加设备 5 STM32配置 5.1 基础参数 5.2 功能定义 6 STM32代码 本文主要是记述一下,如何使用阿里云物联网平台,创建一个简单的远程控制小灯示例。 完整工程&a…

Flink底层原理解析:案例解析(第37天)

系列文章目录 一、flink架构 二、Flink底层原理解析 三、Flink应用场景解析 四、fink入门案例解析 文章目录 系列文章目录前言一、flink架构1. 作业管理器(JobManager)2. 资源管理器(ResourceManager)3. 任务管理器(Ta…

【数学建模】高温作业专用服装设计(2018A)隐式差分推导

为方便计算,对区域进行离散化处理,采用隐式差分格式进行离散计算。隐式差分格式如图: 每层材料内部 对第 j j j层材料: 其中, λ j \lambda_j λj​表示第 j j j层的热扩散率, c j c_j cj​表示第 j j j层的比热容…

RFID(NFC) CLRC663非接触读取芯片GD32/STM32 SPI读取

文章目录 基本介绍硬件配置连接硬件连接详解程序代码代码解释 基本介绍 CLRC663 是高度集成的收发器芯片,用于 13.56 兆赫兹的非接触式通讯。CLRC663 收发器芯片支 持下列操作模式 • 读写模式支持 ISO/IEC 14443A/MIFARE • 读写模式支持 SO/IEC 14443IB • JIS X…

全网超详细Redis主从部署(附出现bug原因)

主从部署 整体架构图 需要再建两个CentOs7,过程重复单机部署 http://t.csdnimg.cn/zkpBE http://t.csdnimg.cn/lUU5gLinux环境下配置redis 查看自己ip地址命令 ifconfig 192.168.187.137 进入redis所在目录 cd /opt/software/redis cd redis-stable 进入配置文件 vim redi…

【JavaEE精炼宝库】 初识网络原理——网络通信基础 | 协议

文章目录 一、网络发展史1.1 独立模式:1.2 网络互连:1.3 局域网(LAN):1.4 广域网(WAN): 二、网络通信基础2.1 IP地址:2.2 端口号: 三、协议3.1 协议的概念&am…

Python基础语法篇(上)

Python基础语法(上) 一、基知二、基本数据类型(一)标准数据类型(二)数据类型转换 三、字符串基本操作(一)字符串的索引和切片(二)字符串的拼接 三、运算符四、…

在golang中Sprintf和Printf 的区别

最近一直在学习golang这个编程语言,我们这里做一个笔记就是 Sprintf和Printf 的区别 fmt.Sprintf 根据格式化参数生成格式化的字符串并返回该字符串。 fmt.Printf 根据格式化参数生成格式化的字符串并写入标准输出。由上面就可以知道,fmt.Sprintf返回的…

AI第二课堂第一次笔记

conda的使用 在输入cmd进入终端后,使用命令 conda create -n env_name python3.10 创建环境 命令 conda activate env_name 打开环境,如:使用 conda deactivate退出指令 2.python一些常见操作 python中的文件打开与关闭 调开源的库 p…

C++--lambda表达式

介绍 一个lambda表达式表示一个可调用的代码单元。我们可以将其理解为一个未命名的内联函数。和函数类型,lambda有一个返回值,一个参数列表和一个函数体,但比函数多一个捕获列表。具体形式如下: [捕获列表](参数列表) ->返回值类型 {函数体}其中:捕获列表:可以捕获定义lam…

NineData全面支持PostgreSQL可视化表结构设计

“PostgreSQL 是最像 Oracle 的开源关系型数据库“,也正因为如此,很多企业都青睐 PostgreSQL,拿它当成 Oracle 的替代品。所以毫无疑问,目前 PostgreSQL 在企业中非常常见。 对于直接接触 PostgreSQL 的开发人员而言,…

60K起?“软件安全岗”比“网络安全岗”薪资高在哪里?

在网络世界的江湖中,“软件安全”与“网络安全”这两大“武林高手”都肩负着守护数字领域和平的重任。不过,眼尖的小伙伴们可能发现了,软件安全岗位的薪资待遇往往比网络安全岗位要丰厚那么一些,这到底是为啥呢?今天&a…

使用ETLCloud实现MySQL数据库与StarRocks数据库同步

在现代数据架构中,数据同步是保证数据一致性和分析准确性的关键步骤之一。本文将介绍如何利用ETLCloud技术实现MySQL数据库与StarRocks数仓数据库的高效数据同步,以及其在数据管理和分析中的重要性。 数据同步的重要性 在数据驱动的时代,企…

【紫光同创盘古PGX-Nano教程】——(盘古PGX-Nano开发板/PG2L50H_MBG324第十三章)蓝牙透传实验例程说明

本原创教程由深圳市小眼睛科技有限公司创作,版权归本公司所有,如需转载,需授权并注明出处(www.meyesemi.com) 适用于板卡型号: 紫光同创PG2L50H_MBG324开发平台(盘古PGX-Nano) 一:…

OZON成本低卖价高产品,OZON单价高产品

Top1 Crocs鞋扣配件 Джиббитсы набор украшения для обуви крокс значки на crocs клипсы аксессуары украшение для сабо бутылка вина бокал 商品id:1409545850…

第一百六十七节 Java IO教程 - Java Zip字节数组

Java IO教程 - Java Zip字节数组 校验和 Java在java.util.zip包中提供了一个Adler32类来计算数据字节的Adler-32校验和。 我们需要调用这个类的update()方法将字节传递给它。 在同一个包中还有另一个名为CRC32的类,它允许您使用CRC32算法计算校验和。 以下代码…

使用geoipupdate自动更新GeoIP数据库

一、 什么是 GeoIP? 通过在数据库中将地理位置和 IP 地址相互映射,软件程序便可以使用 IP 地址来确定其对应的地理位置,其中包括国家/地区、州/省、城市、邮政编码、纬度/经度、ISP、区号和其他信息。 很多软件都使用 MaxMind 的数据库对 IP…