【大厂AI课学习笔记NO.50】2.3深度学习开发任务实例(3)任务背景与目标

我们经常在做项目的时候,觉得分析背景和目标是浪费时间,觉得不过如此。

其实目标梳理特别重要,直接决定你数据的需求分析,模型的选择,决定你交付的质量。

人工智能项目也和其他项目一样,不要想当然,不要自己闷头去干。

当前的课程,给了一个玩具小车,在赛道上识别交通标志的深度学习案例,图像识别的图像分类。

背景:玩具车增加识别交通指示牌的能力。

目标:利用玩具车的前置摄像头,检测交通标志的位置。

任务过程包括:

  • 明确数据采集需求
  • 制作数据集
  • 模型训练
  • 模型评测

 

效果就是这样的。

我们可以看到,赛道是类似纸张铺设的,所以不平整。玩具交通标志,被用检测框标记出来。是很小的立起来的小牌子,塑料的,所以很容易有俯仰角、翻滚角等问题。

 计算机视觉(CV)实际应用中。

我们要注意,除了关注的主体,还有很多其他要关注的信息,比如背景、光照;

我们在做图像识别,那么光就是最重要的因素。是不是有逆光、背光、面向光?如果样本图片,不包含这些情况,那么训练出来的模型,就将出现准确率和召回率都很低的情况。

还有客户给我们讲需求时,由于客户不理解这些,可能认为一切很简单,给的项目预算,就有问题,而实际,在这个项目中,我们要采集甚至超过1万个样本,都要进行特征标注,这是非常大的工作量,都要项目经费去支撑。

作为项目负责人,如果忽略了这一点,也将导致项目无法继续交付和落地。

延伸学习:


在深度学习中,图像分类是一个复杂且具有挑战性的任务。以下是一些难点和注意事项:

难点:

  1. 数据集的质量和多样性:图像分类的性能在很大程度上取决于训练数据的质量和多样性。如果数据集不够大、标注不准确或者缺乏多样性,那么模型的泛化能力可能会受到限制。
  2. 模型的复杂性:图像分类需要处理大量的输入数据,并学习从这些数据中提取有用的特征。因此,模型需要具有足够的复杂性来捕捉这些特征,但同时也要避免过拟合。
  3. 光照和视角变化:图像中的光照和视角变化可能会对模型的性能产生负面影响。模型需要能够处理这些变化,并正确地分类图像。
  4. 类别不平衡:在某些数据集中,某些类别的样本数量可能远多于其他类别,这可能导致模型在训练过程中偏向这些样本数量较多的类别。

注意事项:

  1. 数据预处理:在进行图像分类之前,需要对图像进行适当的预处理,如缩放、裁剪、归一化等,以确保输入数据的一致性和模型的稳定性。
  2. 模型选择:根据具体任务和数据集的特点选择合适的模型。目前有许多先进的深度学习模型可用于图像分类,如卷积神经网络(CNN)、残差网络(ResNet)等。
  3. 调参技巧:在训练过程中,需要合理地设置学习率、批大小等超参数,并使用优化算法来加速训练过程。同时,还需要关注模型的过拟合问题,并采取相应的措施来避免过拟合。

目前最先进的模型和算法:

在图像分类领域,目前最先进的模型之一是EfficientNet系列模型。EfficientNet通过一种称为复合缩放的方法,在保持计算效率和精度的同时,实现了更高的性能。此外,还有许多其他优秀的模型,如ViT(Vision Transformer)等。

在算法方面,除了传统的梯度下降算法外,还有许多优化算法可用于加速训练过程和提高模型性能,如Adam、RMSProp等。这些算法可以根据具体任务和数据集的特点进行选择。

工具:

目前有许多深度学习框架和工具可用于图像分类任务,如TensorFlow、PyTorch、Keras等。这些工具提供了丰富的API和预训练模型,可以方便地构建和训练深度学习模型。此外,还有一些可视化工具可以帮助我们更好地理解模型的训练过程和性能,如TensorBoard等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2803263.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

7-liunx服务器规范

目录 概况liunx日志liunx系统日志syslog函数openlog 可以改变syslog默认输出方式 ,进一步结构化 用户信息进程间的关系会话ps命令查看进程关系 系统资源限制改变工作目录和根目录服务器程序后台话 概况 liunx服务器上有很多细节需要注意 ,这些细节很重要…

Redis进阶篇

Redis线程模型 redis是基于内存运行的高性能k-v数据库,6.x之前是单线程, 对外提供的键值存储服务的主要流程 是单线程,也就是网络 IO 和数据读写是由单个线程来完成,6.x之后引入多线程而键值对读写命 令仍然是单线程处理的,所以 …

智能未来之路:《NIST AI RMF 1.0》与负责任的AI发展

引言 在当今快速发展的人工智能领域,美国国家标准与技术研究院(NIST)发布的《NIST AI RMF 1.0》框架是一个标志性的里程碑。这一框架不仅为AI技术的负责任和可信赖使用提供了重要指导,而且对于推动可持续的AI发展具有深远影响。本…

CrossOver虚拟机软件2024有哪些功能?最新版本支持哪些游戏?

CrossOver由codewaver公司开发的类虚拟机软件,目的是使linux和Mac OS X操作系统和window系统兼容。CrossOver不像Parallels或VMware的模拟器,而是实实在在Mac OS X系统上运行的一个软件。CrossOvers能够直接在Mac上运行Windows软件与游戏,而不…

创建型设计模式 - 原型设计模式 - JAVA

原型设计模式 一 .简介二. 案例三. 补充知识 前言 这是我在这个网站整理的笔记,有错误的地方请指出,关注我,接下来还会持续更新。 作者:神的孩子都在歌唱 一 .简介 原型模式提供了一种机制,可以将原始对象复制到新对象&#xff0…

一文读懂什么是 IP 欺骗

IP欺骗被认为是最容易发起且最具破坏性的攻击之一。这种攻击方式通过伪造源IP地址来隐藏攻击者的真实身份,从而可以逃避追踪和封锁。由于IP欺骗的隐蔽性和难以追踪性,它经常被用于发起各种恶意攻击,如DDoS攻击、网络钓鱼和诈骗、内部网络攻击…

DM数据库学习之路(十八)DMHS数据实时同步软件部署及迁移测试

​​​​​ DMDRS介绍 产品介绍 达梦数据实时同步软件(以下简称 DMDRS)是支持异构环境的高性能、高可靠、高可扩展数据库实时同步复制系统。该产品采用基于日志的结构化数据复制技术,不依赖主机上源数据库的触发器或者规则,对主…

docker部署seata1.6.0

docker部署seata1.6.0 Seata 是 阿里巴巴 开源的 分布式事务中间件,解决 微服务 场景下面临的分布式事务问题。需要先搭建seata服务端然后与springcloud的集成以实现分布式事务控制的过程 ,项目中只需要在远程调用APi服务的方法上使用注解 GlobalTransa…

电商+支付双系统项目------电商系统中收货模块的开发

本篇文章是讲关于项目的收货地址模块的设计。这个就比较简单了,我就不像之前的文章讲的那么详细了,就简单讲讲就好。 首先先设计 DAO 层: package com.imooc.mall.dao;import com.imooc.mall.pojo.Shipping; import org.apache.ibatis.annot…

分类预测 | Matlab实现KPCA-ISSA-LSSVM基于核主成分分析和改进的麻雀搜索算法优化最小二乘支持向量机故障诊断分类预测

分类预测 | Matlab实现KPCA-ISSA-LSSVM基于核主成分分析和改进的麻雀搜索算法优化最小二乘支持向量机故障诊断分类预测 目录 分类预测 | Matlab实现KPCA-ISSA-LSSVM基于核主成分分析和改进的麻雀搜索算法优化最小二乘支持向量机故障诊断分类预测分类效果基本描述程序设计参考资…

Unity接入SQLite (一):SQLite介绍

1.简介 SQLite是一个开源的嵌入式关系数据库管理系统。它是一种轻量级的数据库引擎,不需要单独的服务器进程,可以直接嵌入到应用程序中使用。Sqlite使用简单、高效,并且具有对标准SQL的完整支持。它适用于需要在本地存储和访问数据的应用程序…

wordpress免费主题模板

免费大图wordpress主题 首页是一张大图的免费wordpress主题模板。简洁实用,易上手。 https://www.jianzhanpress.com/?p5857 wordpress免费模板 动态效果的wordpress免费模板,banner是动态图片效果,视觉效果不错。 https://www.jianzhan…

C++从入门到精通 第六章(函数)

写在前面: 本系列专栏主要介绍C的相关知识,思路以下面的参考链接教程为主,大部分笔记也出自该教程,笔者的原创部分主要在示例代码的注释部分。除了参考下面的链接教程以外,笔者还参考了其它的一些C教材(比…

学习Markdown

https://shadows.brumm.af 欢迎使用Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑器进行了一些…

什么是MapReduce

1.1 MapReduce到底是什么 Hadoop MapReduce是一个软件框架,基于该框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。这个定…

Flutter插件开发指南01: 通道Channel的编写与实现

Flutter插件开发指南01: 通道Channel的编写与实现 视频 https://www.bilibili.com/video/BV1ih4y1E7E3/ 前言 本文将会通过一个加法计算,来实现 Channel 的双向通讯,让大家有个一个体会。 Flutter插件 Flutter插件是Flutter应用程序与原生平台之间的桥…

1.CSS单位总结

CSS 单位总结 经典真题 px 和 em 的区别 CSS 中的哪些单位 首先,在 CSS 中,单位分为两大类,绝对长度单位和相对长度单位。 绝对长度单位 我们先来说这个,绝对长度单位最好理解,和我们现实生活中是一样的。在我们…

WordPress关键漏洞影响25000+站点;Cisco漏洞被勒索软件利用;朝鲜黑客瞄准全球国防公司 | 安全周报 0223

1. CISA警告:Akira勒索软件正在利用Cisco ASA/FTD 漏洞 近日,美国网络安全和基础设施安全局(CISA)发布了一份警告,指出Akira勒索软件正在积极利用Cisco的Adaptive Security Appliance (ASA) 和 Firepower Threat Defe…

2022云边协同大会:核心内容与学习收获(附大会核心PPT下载)

云计算进入惠普发展期,边缘计算需求激增,云边协同成为未来重要演进方向。同时,5G的规模建设和边缘计算的持续部署,驱动数据处理向边端扩散,使算力走向泛在化,云边端一体化驱动算力更好的满足社会各界不同需…

普中51单片机学习(DS1302)

DS1302时钟 DS1302实时时钟具有能计算2100年之前的秒、分、时、日、日期、星期、月、年的能力,还有闰年调整的能力。内部含有31个字节静态RAM,可提供用户访问。采用串行数据传送方式,使得管脚数量最少,简单SPI 3线接口。工作电压…