AI基础知识(2)--决策树,神经网络

1.什么是决策树?

决策树是一类常见的机器学习方法,决策树是基于树的结构来进行决策。决策过程中提出的每一个问题都是对于属性的“测试”,决策的最终结论对应了我们希望的判定结果。一个决策树包含一个根节点,若干个内部节点和若干个叶子节点。其中叶子节点对应于决策结果,其他每一个节点对应于一个属性测试。每个结点对应的样本集合,根据属性测试被划分到子节点中,流程遵循递归“分而治之”(divide-and-conquer)的策略。引用《机器学习》西瓜书的图片:

2. 什么是信息熵(information entropy)?

是度量样本集合纯度(purity)的一种指标,信息熵越小,集合纯度越高。对于集合D的信息熵计算公式如下,其中pk是集合中第k类样本所占的比例:

3.什么是信息增益(information gain)?

信息增益越大,意味着使用属性a所划分获得的纯度提升越大。一般决策树的结点选择当前信息增益最大的属性作为划分结点,公式如下,其中Dv表示D中所有在属性a上取值为av的样本:

4.什么是增益率(gain ratio)?

信息增益对可取值数目较多的属性有所偏好,为了减少这种偏好带来的不利影响。引入了增益率,增益率对可取值数目较少的属性有所偏好。增益率准则使用的时候,先选择高于平均信息增益水平的attribute,然后再从中选择增益率最高的。

5.什么是剪枝(pruning)?

剪枝是决策树解决过拟合的一种方法,通过主动去掉一些分支来解决过拟合的风险。基本策略有预剪枝(pre-pruning)和后剪枝(post-pruning)。预剪枝是基于信息增益准则,我们首先要选择一个信息增益高的结点进行划分,预剪枝要使用性能评估方法对划分前后的泛化性能进行估计。后剪枝是先从训练集生成一棵完整的决策树,然后自底向上对所有结点进行逐一考查,训练时间开销比未剪枝和预剪枝都大。

6.什么是神经网络(neural network)?

神经网络是具有适应性的简单单元组成的广泛并行互联的网络,它的组织能够模拟真实神经系统对现实世界做出的反应,是一个包含很多参数的数学模型。神经网络的学习过程,就是根据训练数据来调整神经元之间的“连接权”(connection weight)以及每一个功能神经元的阈值。

7.什么是感知机(perceptron)?

感知机由输入层神经元和输出层神经元组成,输入层接收外界信号传递给输出层,输出层是M-P神经元。感知机只有输出层是功能神经元(function neuron),即只有输出层用激活函数进行处理。若感知机预测正确则 w 不修改,否则 w 按照学习率进行修改\Delta w。感知机只能处理线性可分问题(linearly neuron),如果是线性可分问题,那么感知机的学习过程一定会收敛(converge);否则感知机的学习过程会发生振荡(fluctuation),即 w 不会收敛成为一个稳定的向量。

8.什么是多层前馈神经网络(multi-layer feedforward neural network)?

是一种常见的神经网络,每一层神经元与下一层神经元互连,神经元之间不存在同层连接,也不存在跨层连接。其中输入层接收神经元输入,隐含层(hidden layer)和输出层神经元对信号进行最终加工(激活函数),最终结果由输出层神经元输出。

                    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2871655.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins通知目标服务器拉取Harbor镜像部署

1.告诉目标服务器拉取哪个镜像 2.判断当前有没有正在运行此容器,有就删除 3.接着查看拉取的镜像目标服务器上是否已存在,有就删除 4.拉取Harbor镜像 5.运行容器 目标服务器编写脚本 创建个部署脚本 vim deploy.sh告诉目标服务器Harbor地址、仓库、镜像…

小白DB补全计划Day1-LeetCode:SQL基本操作select

前言:找工作(主人)的任务罢了 链接:1757. 可回收且低脂的产品 - 力扣(LeetCode) 584. 寻找用户推荐人 - 力扣(LeetCode) 来源:LeetCode 对DB篇的SQL章不太知道怎么写…

智能合约设计模式:讲解代理模式及其安全漏洞

苏泽 大家好 这里是苏泽 一个钟爱区块链技术的后端开发者 本篇专栏 ←持续记录本人自学两年走过无数弯路的智能合约学习笔记和经验总结 如果喜欢拜托三连支持~ 我们首先来看看什么是设计模式 和我们软件工程里面的设计模式有什么异同? 智能合约设计模式是一种在区…

使用 GitHub Actions 通过 CI/CD 简化 Flutter 应用程序开发

在快节奏的移动应用程序开发世界中,速度、可靠性和效率是决定项目成功或失败的关键因素。持续集成和持续部署 (CI/CD) 实践已成为确保满足这些方面的强大工具。当与流行的跨平台框架 Flutter 和 GitHub Actions 的自动化功能相结合时,开发人员可以创建无…

实战!wsl 与主机网络通信,在 wsl 中搭建服务器。学了计算机网络,但只能刷刷面试题?那也太无聊了!这篇文章可以让你检测你的计网知识!

前言(碎碎念):每次发布文章时,我都是一个纠结的过程。因为我给自己写笔记时,只需要记录自己不清晰或者易忘的知识点就可以了,但一旦想要作为文章发布,那么我就得考虑到很多人是纯新手&#xff0…

智慧公厕是什么?让公共厕所的“生命体征”有了“监测大脑”

智慧公厕是指将公共厕所进行信息化、数字化、智慧化的升级改造,针对公共厕所使用、运行、管理、养护等全方位业务流程进行优化。它不仅仅是传统公共厕所的升级版,更是公共厕所管理的一种全新方式。智慧公厕的独特之处在于,把公共厕所作为一个…

RequestResponse案例

文章目录 一、用户登录1、环境准备数据库准备导入MyBatis坐标,MySQL驱动坐标mybatis-config.xml准备UserMapper.xml 2、流程说明UserMapper接口login.htmlLoginServlet 二、用户注册register.htmlRegisterServlet 一、用户登录 1、环境准备 数据库准备 create data…

深度学习-面经(part2、CNN)

2 CNN 对图像(不同的数据窗口数据)和滤波矩阵做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作。 卷积神经网络由输入层、卷积层、激励层、池化层、全连接层组成。 ① 最左边: 数据输入层,对数据做一些处理…

2024年腾讯云免费服务器在哪领取?

腾讯云免费服务器申请入口 https://curl.qcloud.com/FJhqoVDP 免费服务器可选轻量应用服务器和云服务器CVM,轻量配置可选2核2G3M、2核8G7M和4核8G12M,CVM云服务器可选2核2G3M和2核4G3M配置,腾讯云服务器网txyfwq.com分享2024年最新腾讯云免费…

wordpress子比主题7.6美化插件及新手零基础搭建教程源码下载

版权申请:本文A5资源网原创,经原创作者允许转载许可声明。下载地址http://a5.org.cn/a5_ziyuan/39172.html 本源码由网友在某宝二十几元购买,现分享给大家。下图为源码文件及演示图,安装教程比较详细新手零基础就可搭建 子比主…

操作系统IO模型

IO模型 如何进行网络通信 Socket通信是进程通讯的一种方式,通过调用这个网络库的一些API函数可以实现分布在不同主机的相关进程之间的数据交换 网络编程的基本流程是什么? 服务端先创建socket套接字,然后用这个套接字去绑定并监听某个端口&a…

YOLOv9改进策略:注意力机制 | 用于微小目标检测的上下文增强和特征细化网络ContextAggregation,助力小目标检测,暴力涨点

💡💡💡本文改进内容:用于微小目标检测的上下文增强和特征细化网络ContextAggregation,助力小目标检测 yolov9-c-ContextAggregation summary: 971 layers, 51002153 parameters, 51002121 gradients, 238.9 GFLOPs 改…

Redis数据结构对象之列表对象

列表对象 概述 ziplist编码的列表对象使用压缩列表作为底层实现,每个压缩列表节点(entry)保存了一个列表元素。 例子如下。如果numbers键的值对象使用的是ziplist编码,这个这个值对对象将会是如图所示的样子。 另一方面,linkedlist编码的列…

SAR ADC教程系列5——FFT频谱泄露以及相干采样

频谱泄露的出现以及如何规避? 为什么要相干采样? 1.分析ADC输出信号的频谱工具:DFT(Discrete Fourier Transform) 重点:DFT相邻频谱频率间隔为fs/N 如何规避频谱泄露? 对于DFT,它对于接收到的信…

算法打卡day15|二叉树篇04|Leetcode 110.平衡二叉树、257. 二叉树的所有路径、404.左叶子之和

算法题 Leetcode 110.平衡二叉树 题目链接:110.平衡二叉树 大佬视频讲解:平衡二叉树视频讲解 个人思路 可以用递归法,计算左右子树的高度差,当超过1时就不为平衡二叉树了; 解法 回顾一下二叉树节点的深度与高度; …

旧华硕电脑开机非常慢 电脑开机黑屏很久才显示品牌logo导致整体开机速度非常的慢怎么办

前提条件 电池需要20%(就是电池没有报废)且电脑接好电源,千万别断电,电脑会变成砖头的 解决办法 更新bios即可解决,去对应品牌官网下载最新的bios版本就行了 网上都是一些更新驱动啊

leetcode代码记录(每日温度

目录 1. 题目:2. 我的代码:小结: 1. 题目: 给定一个整数数组 temperatures ,表示每天的温度,返回一个数组 answer ,其中 answer[i] 是指对于第 i 天,下一个更高温度出现在几天后。如…

Docker 哲学 - 容器操作 -cp

1、拷贝 容器绑定的 volume的 数据,到指定目录 2、匿名挂载 volume 只定义一个数据咋在容器内的path,docker自动生成一个 sha256 的key作为 volume 名字。这个 sha256 跟 commitID 一致都是唯一的所以 ,docker利用这个机制,可以…

5分钟教你激活喀秋莎Camtasia2023中文破解Crack下载附安装教程

Camtasia2023又称喀秋莎2023,集屏幕录制和视频剪辑功能于一体的软件,提供屏幕录制、区域录制、摄像头录制等多种录制方式,Camtasia2023版本带来了新的动态背景库、霓虹光标图像、录制语音旁白等多种新功能,适用于游戏录制、课程录…

ISIS接口MD5 算法认证实验简述

默认情况下,ISIS接口认证通过在ISIS协议数据单元(PDU)中添加认证字段,例如:MD5 算法,用于验证发送方的身份。 ISIS接口认证防止未经授权的设备加入到网络中,并确保邻居之间的通信是可信的。它可…