高级统计方法 第4次作业

作业评阅:

概念

2.问题

KNN分类和KNN回归都是KNN算法在不同类型数据上的应用,但它们之间存在明显的区别。

解决的问题类型不同:KNN分类适用于解决分类问题,而KNN回归则适用于解决回归问题。当响应变量是连续的,根据输入和回归函数,预测输出;当响应变量是带有一定水平的因子型变量,就可以用来将输入变量进行分类。

决策方式不同:在预测阶段,KNN做分类时,通常采用多数表决法,即根据训练集中与预测样本特征最近的K个样本,将预测为包含最多类别数的类别。而KNN做回归时,则通常采用平均法,即取最近的K个样本的输出平均值作为回归预测值。

5.问题(略)

、、、、、、

应用

9.问题(略)

(a)问题(略)

Auto = read.csv("Auto.csv", header=T, na.strings="?")

Auto = na.omit(Auto)

Auto[,9] = as.numeric(factor(Auto[,9]))

pairs(Auto)

(b)问题(略)

cor(subset(Auto, select=-name))

(c)问题(略)

lm.fit1 = lm(mpg~.-name, data=Auto)

summary(lm.fit1)

预测变量和响应变量之间有关系,通过观察p值和t值等数据可以判别是否拒绝原假设,从而判别是否有关系,可以明显的看出有关联。

weight, year, origin这些预测变量和响应变量统计上有明显关系。

mgp随着year的变化在统计意义上有显著关联。

(d)

par(mfrow=c(2,2))

plot(lm.fit1)

可以看出残差有很明显的曲线,分布并不均匀。

plot(predict(lm.fit1), rstudent(lm.fit1))

可能存在异常值,因为存在值大于3的数据。

(e)

lm.fit2 = lm(mpg~cylinders*displacement+displacement*weight,data=Auto)

summary(lm.fit2)

cylinders*displacement之间的相互作用没有统计学意义。

displacement*weight之间的相互作用有统计学意义。

(f)

预测logX的变换

lm.fit3=lm(mpg~log(weight)+sqrt(horsepower)+acceleration+I(acceleration^2),data=Auto)

summary(lm.fit2)

par(mfrow=c(2,2))

plot(lm.fit3)

plot(predict(lm.fit3), rstudent(lm.fit3))

对数变换的残差图分布更为均匀,可以看出对数优化更有效。

10.问题(略)

(a)问题(略)

install.packages('ISLR')

library(ISLR)

summary(Carseats)

attach(Carseats)

lm.fit = lm(Sales~Price+Urban+US)

summary(lm.fit)

(b)问题(略)

Price:

P值低,表明拒绝零假设,价格和销售之间存在关系。并且之间呈负相关,价格上涨销量下降。

UrbanYes:

P值0.936,很大可以拒绝零假设,说明商店的位置和销量之间没有关系。

USYes:

P值低,说明商店是否在美国和销售额有关系,并且呈正相关。

(c)问题(略)

Sales = 13.04 - 0.05 Price - 0.02 UrbanYes + 1.20 USYes

(d)

Price和USYes 可以拒绝零假设。

(e)

lm.fit2 = lm(Sales ~ Price + US)

summary(lm.fit2)

(f)

分析RES和R^2,他们对数据的拟合程度相近。

(g)

confint(lm.fit2)

(h)

plot(predict(lm.fit2), rstudent(lm.fit2))

观察到残差在-3到3之间,并没有明显的离群点。

par(mfrow=c(2,2))

plot(lm.fit2)

有高杠杆点,可以看到有远大于总体值的数据。

14.问题(略)

(a)问题(略)

set.seed(1)

x1 = runif(100)

x2 = 0.5 * x1 + rnorm(100)/10

y = 2 + 2*x1 + 0.3*x2 + rnorm(100)

(b)问题(略)

cor(x1, x2)

plot(x1, x2)

(c)问题(略)

lm.fit = lm(y~x1+x2)

summary(lm.fit)

β0=2.1305,β1=1.4396,β2=1.0097

β1,β2的标准差和p值较高,拒绝β1,β2.

(d)

lm.fit = lm(y~x1)

summary(lm.fit)

我们可以拒绝零假设,因为p值极小。

(e)

lm.fit = lm(y~x2)

summary(lm.fit)

我们可以拒绝零假设,因为p值极小。

(f)

不矛盾,x1和x2互有影响。当被单独回归时其线性关系更清楚的指示出。

(g)

x1 = c(x1, 0.1)

x2 = c(x2, 0.8)

y = c(y, 6)

lm.fit1 = lm(y~x1+x2)

summary(lm.fit1)

lm.fit2 = lm(y~x1)

summary(lm.fit2)

lm.fit3 = lm(y~x2)

summary(lm.fit3)

par(mfrow=c(2,2))

plot(lm.fit1)

par(mfrow=c(2,2))

plot(lm.fit2)

par(mfrow=c(2,2))

plot(lm.fit3)

在第一和第三个模型中,这个点变成了一个高杠杆点。

plot(predict(lm.fit1), rstudent(lm.fit1))

plot(predict(lm.fit2), rstudent(lm.fit2))

plot(predict(lm.fit3), rstudent(lm.fit3))

模型2有距截止点远的点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2806416.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

我花了5天时间,开发了一个在线学习的小网站

大三寒假赋闲在家,闲来无事,用了5天时间做了一个在线学习的小网站,一鼓作气部署上线,制作的过程比较坎坷。内心经历过奔溃,也经历过狂喜。 按照惯例先放出网址,欢迎大家来访问学习:www.pbjlove…

大离谱!AI写作竟让孔子遗体现身巴厘岛,看完笑不活了

大家好,我是二狗。 这两天我在知乎上看到了一个AI写作大翻车的案例,看完简直笑不活了,特地分享给大家一起 happy happy~ 知乎网友“打开盒子吓一跳”一上来就抛出来了一个“孔子去世”的王炸。 首先,下面是一条真实新…

每日一题——LeetCode1512.好数对的数目

方法一 暴力循环 var numIdenticalPairs function(nums) {let ans 0;for (let i 0; i < nums.length; i) {for (let j i 1; j < nums.length; j) {if (nums[i] nums[j]) {ans;}}}return ans; }; 消耗时间和内存情况&#xff1a; 方法二&#xff1a;组合计数 var …

智胜未来,新时代IT技术人风口攻略-第七版(弃稿)

文章目录 前言鸿蒙生态科普调研人员画像角色先行结论 - 市场下的增量蛋糕高校助力鸿蒙 - 掀起鸿蒙教育热潮高校鸿蒙课程开设占比 - 巨大需求背后是矛盾冲突教研力量并非唯一原因 - 看重教学成果复用与效率 企业布局规划 - 多元市场前瞻视野全盘接纳仍需一段时间 - 积极正向的一…

植物神经功能紊乱不治疗最坏后果会怎样?

植物神经功能紊乱是一种常见的疾病&#xff0c;它可以对人体的生理和心理产生严重的影响。如果不加以治疗&#xff0c;其最坏的后果将会是非常危险的。 植物神经功能紊乱是由于各种原因导致自主神经系统异常活跃或抑制而引起的一系列症状的总称。自主神经系统是负责自主调…

java基础-正则表达式+文件操作+内置包装类

目录 正则表达式去除字符串前后空格&#xff1a;去除每一行中首尾的空格去除开头的 数字_ 文件操作打印当前项目路径获取文件的上级目录/和\读取文件 内置包装类System类常用方法 Number类Integer类常用方法Float和Double 正则表达式 去除字符串前后空格&#xff1a; str.tri…

uTools:打造你的个性化效率工具箱

名人说&#xff1a;莫道桑榆晚&#xff0c;为霞尚满天。——刘禹锡&#xff08;刘梦得&#xff0c;诗豪&#xff09; 创作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 一、什么是uTools&#xff1f;①uTools②功能 二…

进程与线程之进程的理解

首先对堆栈等进程运行过程中的内存有了更深层次的理解&#xff1a; 我们之前了解到&#xff0c;程序在运行中存在堆栈&#xff0c;字符串常量区代码区。 现在我们提出虚拟内存的概念&#xff1a;程序在运行的过程中开辟0~4G的虚拟空间使用MUU映射单元映射到物理地址上 简而言…

28V、115V、270V坦克装甲车启动电源:为现代战争注入新能量

28V、115V、270V坦克装甲车启动电源&#xff1a;为现代战争注入新能量 世界新格局的诞生后&#xff0c;现代战争已经从传统的陆地、海洋、空中扩展到了网络空间和外太空。在这种背景下&#xff0c;各种先进的武器装备不断涌现&#xff0c;为国家安全提供有力保障。28V、115V、2…

【Unity】提示No valid Unity Editor liscense found.Please active your liscense.

有两个软件&#xff0c;如果只有一个&#xff0c;点黑的不会有效果、、、、&#xff08;楼主是这个原因&#xff0c;可以对号入座一下&#xff09; 简而言之&#xff0c;就是去下载Unity Hub&#xff0c;再里面激活管理通行证 问题情境&#xff1a; 点击unity出现以下弹窗&a…

C语言-指针详解速成

1.指针是什么 C语言指针是一种特殊的变量&#xff0c;用于存储内存地址。它可以指向其他变量或者其他数据结构&#xff0c;通过指针可以直接访问或修改存储在指定地址的值。指针可以帮助我们在程序中动态地分配和释放内存&#xff0c;以及进行复杂的数据操作。在C语言中&#…

一些PCB整改优化经验总结

一个UP的PCB整改经验&#xff1a; 当正面全局铺铜之后出现很多小铜皮碎片的时候不如不铺铜或者单面铺铜RJ45网口的地和整体的地分开&#xff0c;两地之间通过电容相连&#xff08;整板地一定要相连&#xff09;TVS这种防浪涌高压的器件的地单独铺设&#xff0c;这样当高压来临…

配电网重构知识及matlab实现

配网重构中&#xff0c;很重要的一个约束条件为配网应随时保持开环、辐射的状态&#xff1a; 配电网系统是属于闭环设计但是开环运行的系统&#xff0c;因此&#xff0c;在开关的开闭过程中&#xff0c;随时保持配电网的开环状态时很重要。Mendoza等利用图论&#xff0c;尤其是…

基于ElementUI封装省市区四级联动下拉选择

基于ElementUI封装的省市区下拉级联选择 效果 数据 最新省市区JSON数据获取&#xff1a;https://xiangyuecn.github.io/AreaCity-JsSpider-StatsGov/ 参数说明 参数说明inputNumShow下拉框的数量&#xff0c;最多4个defaultAddress默认显示省市区 例&#xff1a;[‘安徽’, …

音视频剪辑|Windows|抽帧和合帧

什么是抽帧&#xff1f; FFmpeg 抽帧&#xff08;Extracting frames&#xff09;的作用是从视频文件中按需提取单张或多张静止图像&#xff08;帧&#xff09;&#xff0c;并将它们保存为图片文件&#xff08;如 JPEG、PNG 等格式&#xff09;。这一功能在以下场合十分有用&am…

一元函数微分学——刷题(18

目录 1.题目&#xff1a;2.解题思路和步骤&#xff1a;3.总结&#xff1a;小结&#xff1a; 1.题目&#xff1a; 2.解题思路和步骤&#xff1a; 遇到绝对值函数&#xff0c;需要把它转化为分段函数&#xff0c;从而更加方便求导数&#xff1a; 3.总结&#xff1a; 遇到绝对…

Docker容器实战

"爱在&#xff0c;地图上&#xff0c;剥落~" Mysql 容器化安装 我们可以在 docker hub上&#xff0c;进入mysql的镜像仓库&#xff0c;找到适合的版本。 直接拉取镜像: docker pull mysql:latest 我们知道 msyql 的默认端口是 3306 &#xff0c;而且有密码&#x…

计算机网络实验四VLAN与三层交换机

一、实验目的和要求 1&#xff09;掌握VLAN的基本配置方法&#xff0c;理解VLAN的功能和作用&#xff1b; 2&#xff09;掌握三层交换机的基本配置方法。 二、实验环境 1&#xff09;运行Windows 2008 Server/XP/7操作系统的PC一台。 2&#xff09;PacketTracer。 实验内…

电子器件系列63:肖特基二极管NSQ03A04\SS34C

以下是肖特基二极管_SS34C_规格书_SLKOR(萨科微),立创编号C880740 以下是肖特基二极管NSQ03A04的规格书&#xff1a; 稍微比较下参数&#xff0c;发现两者参数接近&#xff0c;ss34的几个参数还要略微好一些&#xff0c;可以用ss34来作替换。 在电源电路中的应用&#xff1a; …

python实现贝尔曼福德算法

对于求图的最短路径问题,如果使用迪杰斯特拉算法,也可以算是一个较为常见的方法,但是对于迪杰斯特拉算法解决最短路径问题的时候,会存在一个问题,那就是所有边所对应的距离都必须是正数,而如果在存在负数的边的时候,迪杰斯特拉算法就会存在问题,而对于存在负数的这种情…