R语言中的常用基础绘图函数 直方图,箱线图,条形图,散点图

目录

R语言中的绘图参数

绘图函数

1.plot函数绘制散点图

2.hist函数绘制直方图

如何修饰直方图?

如何在直方图上标注各组频数?

使用text函数把某些信息标注在直方图上

如何在直方图上添加概率密度曲线?

3.boxplot函数绘制箱线图

4.barplot函数绘制条形图

如何生成横向条形图?


首先介绍一下:在R语言中,当你在调用函数时为参数明确指定名称,那么参数的顺序就不再是必须遵循函数原型定义的顺序。这是因为通过参数名指定值,R能够识别并正确地将值分配给对应的参数,无论这些参数在函数调用中的实际顺序如何。

例如,考虑一个简单的函数定义:

my_function <- function(a, b, c) 

在正常情况下,你会按照a、b、c的顺序传递参数:

result <- my_function(1, 2, 3) 

但是,如果你指定了参数名称,那么这些参数可以以任意顺序出现:

result <- my_function(c = 3, a = 1, b = 2) 且结果相同

这种通过名称指定参数的特性,不仅使得函数调用更加灵活,还可以提高代码的可读性,尤其是在处理有很多参数,且部分参数具有默认值的情况下。此时,明确指出参数名称有助于理解每个参数的作用,避免混淆。这就让我们在使用R中的函数的时候可以不用像C语言那样记住每个参数的位置,而是只需要记住哪个参数是干啥的就行

R语言中的绘图参数

R语言中绘图参数非常多样,它们允许你定制化绘制的图形,以适应不同的需求和偏好。这些参数可以分为几个大类,包括图形参数、文本参数、线条参数、颜色参数等。以下是一些常用的绘图参数及其简要说明:

图形参数

  • pch: 点的类型,可以是数字或符号,控制点的形状。
  • type: 图形类型,如"p"代表点,"l"代表线等。
  • xlim: x轴的范围。
  • ylim: y轴的范围。
  • xlab: x轴的标签。
  • ylab: y轴的标签。
  • main: 图形的主标题。
  • sub: 图形的副标题。

文本参数

  • cex: 文本的缩放比例。
  • col: 文本的颜色。
  • font: 字体样式,如粗体、斜体等。
  • text: 在图形中添加的具体文本。

线条参数

  • lty: 线型,如实线、虚线等。
  • lwd: 线宽。
  • col: 线条的颜色。

颜色参数

  • col: 用于点、线、文本等的颜色。
  • bg: 背景颜色,特定图形元素如柱状图的填充颜色。

边界和布局参数

  • mar: 图形四周的边界空间。
  • oma: 外边界空间。
  • mfrow: 分割窗口,按行排列多个图形。
  • mfcol: 分割窗口,按列排列多个图形。

这只是R语言绘图参数中的一小部分。不同的绘图函数可能会支持不同的参数集合。例如,plot()函数支持的参数与barplot()或hist()可能不同。因此,最佳实践是查阅特定绘图函数的帮助文档来获取完整的参数列表和详细说明。在R中,你可以通过?函数名,如?plot,来访问这些帮助文档。

绘图函数

R语言中有很多用于绘图的函数,这些函数可以分为两大类:基础绘图系统(Base Plotting System)和其他专用图形包如ggplot2、lattice等。下面列出了一些在基础绘图系统中常用的绘图函数及其用途:

  1. plot()

:这是R中最基本的绘图函数,用于创建各种类型的图形,如散点图、线图等。根据提供数据的类型和参数的不同,plot()函数可以生成不同风格的图表。

  1. hist()

:用于绘制直方图,可展示数据的分布情况。

  1. barplot()

:用于绘制条形图,适用于展示分类数据的比较。

  1. boxplot()

:用于绘制箱线图,常用于比较不同组数据的分布情况及中位数等统计信息。

  1. pie()

:用于绘制饼图,表示部分与整体之间的比例关系。

  1. abline()

:在图形中添加直线,常用于添加回归线或参考线。

  1. lines()

:在现有图形上添加线条,常用于折线图的绘制。

  1. points()

:在现有图形上添加点,可用于突出显示特定数据点。

  1. text()

:在图形中添加文本,用于注释或标记。

  1. legend()

:为图形添加图例,有助于解释图中的符号和颜色代表的含义。

  1. axis()

:自定义坐标轴的样式和参数,如刻度、标签等。

除了这些基础绘图函数,R语言中还有其他强大的图形系统和包,如:

  • ggplot2:一种实现了格兰特图形语法的绘图系统,非常灵活和强大,适合复杂的图形制作。
  • lattice:受S语言trellis图形灵感启发的图形包,适用于创建条件图,以展示变量之间的关系。
  • plotly:提供了一个交云互动图表的界面,可以用于创建动态和交互式的Web图形。

这些工具和函数使R成为一个强大的数据可视化工具,无论是基础图形还是复杂的定制化图形,R都能够胜任。

type通常是plot函数中的一个参数,用于设定图像的形式,比如点还是线,下面是一些常见的type参数选项:

  • "p": 只绘制点(Points),不连接。
  • "l": 只绘制线(Lines),不显示点。
  • "b": 同时绘制点和折线,线是连接各数据点的。
  • "o": 同时绘制点和折线,线通过点中心。
  • "h": 绘制垂直线,从每个点到X轴。
  • "s": 阶梯图(Stairsteps),横向直线。
  • "n": 不绘制任何图形,通常用于只添加注释或特殊元素到已存在的图形。

下面来详细介绍几个函数

1.plot函数绘制散点图

运行之后就得到了一幅这样的图

如果在刚才的那句代码中加上axes=F,就会发现坐标轴没了,axes这个参数是用来决定显示坐标轴与否的,默认是显示,如果我们不想让坐标轴显示,可以加上一句axes=F

来看一段代码

col用来设置点的颜色,pch=16来设置点的形状,16表示实圆形,cex设置点的大小,1代表正常大小

这个代码的运行结果如图

2.hist函数绘制直方图

hist()函数在R语言中用于创建直方图,它是用来探索数据集分布特征的重要工具。直方图通过将数据分布到连续的、不重叠的区间(或称“桶”、“bin”)中,来展示在每个区间内数据点的数量。

基本使用

hist()函数的基本语法如下:

hist(x, breaks = "Sturges", freq = NULL, probability = !freq, col = NULL, border = NULL, main = paste("Histogram of" , xname), xlim = NULL, ylim = NULL, xlab = xname, ylab = "Frequency", axes = TRUE, plot = TRUE, labels = FALSE, ...)

主要参数

  • x: 包含要绘制直方图的数值数据的向量。
  • breaks: 用于指定区间(bin)的方法或数值。可以是一个向量,指定每个区间的边界,或者是一个单一数值,指定区间的数量。还可以是一个字符串,指定算法(如"Sturges","Scott","FD"等),自动计算区间数量。
  • freq: 逻辑值,指定是绘制频数直方图(TRUE)还是密度直方图(FALSE)。默认情况下,如果probability未被设置,freq = TRUE。
  • probability: 逻辑值,与freq相反。如果设置为TRUE,y轴显示每个区间的数据点占总数据点的比例。
  • col: 指定直方图柱子的填充颜色。
  • border: 指定直方图柱子边界的颜色。
  • main: 图形的主标题。
  • xlim和ylim: 分别指定x轴和y轴的范围。
  • xlab和ylab: 分别指定x轴和y轴的标签。
  • axes: 逻辑值,指定是否绘制坐标轴。
  • plot: 逻辑值,指定是否绘制直方图。设置为FALSE可以用来仅仅创建直方图的统计数据而不绘制它。
  • labels: 逻辑值,指定是否在每个柱子上方显示其频数或概率。

实际上hist函数中只有一个参数是必须提供的,那就是x,其他的参数如果不提供,系统都会提供一个默认的合适值

示例

下面是一个简单的例子,展示如何使用hist()函数绘制直方图:

这个例子展示了如何生成一个包含100个正态分布随机数的直方图,使用了10个区间,并且设置了直方图的颜色、边界颜色以及各种标签。运行结果如图所示

如果我们加上一个probability=T,就变成了这样

可以发现y轴已经变成了每个区间的数据点占总数据点的比例。

breaks还可以人为规定区间,比如我们这样写

表示区间从-3开始,终止于5,步长为1,于是结果就是这样

再来看一个例子

mtcars是R中自带的一个数据集,mpg是其中一个

breaks可以指定组数,如果不写,系统会自动确定一个组数

我们应该保证breaks的大小能够囊括所给数据中的所有值,如果不知道一个数据集的最大值和最小值,可以使用max函数和min函数来查看

breaks可以人为指定,比如我们可以使用seq函数生成一个等差数列,也可以手动输入一些区间的边界值,人为指定,就可以实现不等距分组

因此总结一下,如果我们要等距分组,可以使用seq函数,如果要实现不等距分组,需要人为输入区间边界值

如何修饰直方图?

如果想要用条纹填充图像中的柱体,可以加一个参数叫做density,同时可以指定条纹的密度,而angle参数可以设定条纹的倾斜程度,默认是45度

参数border用来设定图像里面柱体的边界颜色,比如

图就变成了这样,因为1在R中是黑色

再看这个代码

这段代码表示绘图的数据来自mpg,颜色用绿色,分了五个区间,用条纹填充,条纹的密度是20,角度是30,柱形的边界用红色,主标题改成示例,横坐标标题改成MPG,纵坐标标题改成Freq,cex.main是主标题大小改成正常字体的两倍,cex.lab指的是所有副标题的大小改成正常字体大小的1.5倍,cex.axis表示把横轴和纵轴的刻度标签大小(就是这些0 2 4 6 8啥的)改成正常大小的0.8倍

如何在直方图上标注各组频数?

在使用hist函数绘制直方图的时候实际上会自动保存绘制的图形的参数,比如区间个数,这些参数可以通过$来观察

比如我要查看区间分了多少个

比如我要查看图中每个柱形的数值

使用text函数把某些信息标注在直方图上

在R语言中,text()函数用于在图形上添加文本标签。这个函数非常有用,特别是当你需要在图表中标注特定的点或者提供额外的信息时。使用text()函数可以直接在指定的坐标位置上添加文本。

text()函数的基本用法如下:

text(x, y, labels, col = "color", pos = 4, cex = 1, ...)

其中参数的含义如下:

  • x和y:分别指定文本标签的x和y坐标位置。这些坐标应该与图形中使用的坐标系一致。
  • labels:要添加的文本标签。可以是单个字符串也可以是字符串向量,对应于每个x和y坐标点。
  • col:文本的颜色。
  • pos:文本相对于指定坐标的位置。取值为1到4,分别表示文本位于坐标的下方、左侧、上方、右侧。
  • cex:文本的缩放比例因子,用于调整文本的大小。
  • ...:其他图形参数,如字体类型font,旋转角度srt等。

如图

运行结果为

我们发现添加的信息贴在了这个柱形上,如果想要让他上移一点,可以使用参数adj,这个参数可以是一个值,也可以是两个值,当adj只有一个值时,它指定了文本的水平对齐方式。adj = 0表示左对齐,adj = 0.5表示居中对齐,而adj = 1表示右对齐。

  • 当adj有两个值时,第一个值控制水平对齐,第二个值控制垂直对齐。例如,adj = c(0, 0)会让文本左下对齐,adj = c(0.5, 0.5)则会让文本在指定的坐标点居中对齐,adj = c(1, 1)则让文本右上对齐。

最终结果如下

如何在直方图上添加概率密度曲线?

在R的库函数中有一个函数叫做density,用于估计给定数据的核密度。lines()函数用于在现有的图形上添加线条。

结果如图

这好像什么也没添加?其实不是的,密度曲线已经添加到了这个图中,但是由于这个图是一个频数直方图,纵轴太大,导致我们添加的概率密度曲线看不见,应该先把频数直方图转换成频率直方图,使用参数freq=F,这样就可以直观的观察到密度曲线了

还可以在lines函数中设置参数lwd的大小来改变密度曲线的粗细

3.boxplot函数绘制箱线图

在R语言中,boxplot()函数用于创建箱线图,这是一种用于图形化显示数据分布的标准方式。通过箱线图,可以直观地看到数据的中位数、四分位数、异常值等统计信息。箱线图特别适合比较不同数据集的分布情况。

基本用法

boxplot(x, data = NULL, ...)

  • x:可以是一个向量、数据框(data.frame)、或是一个公式(formula),用于指定要绘制的数据。
  • data:当x是公式时,指定公式中变量的数据框。
  • ...:其他参数和细节设置,如main用于标题,xlab和ylab用于轴标签等

主要组成部分

  • 中位数(Median):箱体中的一条线,表示数据的中位数。
  • 四分位数(Quartiles):箱体的边缘,表示数据的第一四分位数(Q1)和第三四分位数(Q3)。
  • 异常值(Outliers):图上单独标出的点,通常是那些小于Q1-1.5IQR或大于Q3+1.5IQR的值(IQR是四分位距)。
  • 箱体(Box):表示从第一四分位数到第三四分位数的范围。
  • 胡须(Whiskers):从箱体出发到最近的非异常值的线,表示数据的正常范围。

boxplot()函数的强大之处在于其灵活性和配置选项的多样性,可以根据需要调整和自定义各种参数,以达到预期的图形效果。

下面是一个例子

运行结果如图

4.barplot函数绘制条形图

在R语言中,barplot()函数用来创建条形图,这是展示数据分布和比较不同类别数据的一种有效方式。条形图通过条形的高度或长度来表示数据的大小,适合用于展示数量比较、频数统计等。

基本用法

barplot(height, names= NULL, beside = FALSE, ...)

  • height:一个数值向量或矩阵,指定每个条形的高度。
  • names:可选参数,为每个条形指定名字。
  • beside:布尔值,如果为TRUE,则将矩阵的列并排显示,而不是堆叠显示。
  • ...:其他控制图形外观的参数,如main、xlab、ylab、col等用于添加标题、轴标签和颜色等。

简单条形图

示例:堆叠和并排条形图

如何生成横向条形图?

通过设置horiz函数,可以生成横向条形图

结果如图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2869500.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

JVM虚拟机:通过jconsole远程连接解决JVM报错

本文重点 前面我们介绍过的一些工具都是使用命令行的方式来帮助我们完成&#xff0c;本文我们将使用一种图形化界面的方式来远程连接&#xff0c;然后完成关于JVM的检测任务。 jconsole jconsole是一个JVM的检测工具&#xff0c;这个工具任何安装了Java的电脑上都有的&#…

手机网络连接性能API接口:查询手机网络连接性能状态

手机在网状态查询服务是一项非常方便的服务&#xff0c;可以帮助我们随时了解一个手机号码的在网状态。不论是查询自己的手机号码&#xff0c;还是查询他人的手机号码&#xff0c;这个服务都可以帮助我们获取准确的信息。今天&#xff0c;我想和大家介绍一个非常好用的手机在网…

GitHub Actions持续部署

一、概述 1.1Github Action介绍 什么是Github Action ? GitHub Actions是GitHub提供的CI/CD&#xff08;持续集成/持续部署&#xff09;服务。它允许你在GitHub仓库中自动化、定制和执行你的软件开发工作流。你可以发现、创建和分享用于执行任何你想要的工作的操作&#xff0…

《计算机视觉中的深度学习》之目标检测算法原理

参考&#xff1a;《计算机视觉中的深度学习》 概述 目标检测的挑战&#xff1a; 减少目标定位的准确度减少背景干扰提高目标定位的准确度 目标检测系统常用评价指标&#xff1a;检测速度和精度 提高精度&#xff1a;有效排除背景&#xff0c;光照和噪声的影响 提高检测速度…

Spark-Transformation以及Action开发实战

文章目录 创建RDDTransformation以及ActionTransformation开发Action开发RDD持久化共享变量创建RDD RDD是Spark的编程核心,在进行Spark编程是,首要任务就是创建一个初始的RDDSpark提供三种创建RDD方式:集合、本地文件、HDFS文件 集合:主要用于本地测试,在实际部署到集群运…

FAN3224TMX门极驱动器中文资料PDF数据手册引脚图参数价格图片功能特性

产品概述&#xff1a; FAN3223-25 系列双 4A 门极驱动器以较短的开关间隔提供高峰值电流脉冲&#xff0c;用于在低侧开关应用中驱动 N 沟道增强模式 MOSFET。该驱动器提供 TTL 或 CMOS 输入阈值。内部电路将输出保持在低电平&#xff0c;直到电源电压处于运行范围内&#xff0…

在Docker容器中配置`code-server`以访问宿主机的Docker环境

在Docker容器中配置code-server以访问宿主机的Docker环境 部分内容使用gpt生成&#xff0c;但经过测试可用。 要在code-server容器内部安全地管理和访问宿主机的Docker环境&#xff08;主要是为了访问宿主机的texlive&#xff09;&#xff0c;遵循以下步骤能够确保流畅的集成和…

R语言深度学习-5-深度前馈神经网络

本教程参考《RDeepLearningEssential》 本篇我们将学习如何建立并训练深度预测模型。我们将关注深度前馈神经网络 5.1 深度前馈神经网络 我们还是使用之前提到的H2O包&#xff0c;详细可以见之前的博客&#xff1a;R语言深度学习-1-深度学习入门&#xff08;H2O包安装报错解决…

[scikit-learn] 第一章 初识scikit-learn及内置数据集介绍

文章目录 菜鸡镇贴&#xff01;&#xff01;&#xff01;scikit-learn 简要介绍scikit-learn 安装scikit-learn 数据集介绍数据集API介绍LoadersSamples generator 导入数据集demo 菜鸡镇贴&#xff01;&#xff01;&#xff01; scikit-learn 简要介绍 ​ Scikit learn是一个…

RK3568平台开发系列讲解(基础篇)内核是如何发送事件到用户空间

🚀返回专栏总目录 文章目录 一、相关接口函数二、udevadm 命令三、实验沉淀、分享、成长,让自己和他人都能有所收获!😄 一、相关接口函数 kobject_uevent 是 Linux 内核中的一个函数, 用于生成和发送 uevent 事件。 它是 udev 和其他设备管理工具与内核通信的一种方式。…

SDN网络简单认识(1)——概述

一、概述 软件定义网络&#xff08;Software Defined Networking&#xff0c;SDN&#xff09;是一种网络架构理念&#xff0c;旨在使网络灵活和可编程&#xff0c;从而更好地支持动态和高度可扩展的计算环境。SDN通过抽象网络的控制层&#xff08;决策层&#xff09;和数据层&a…

面试经典-MySQL篇

一、MySQL组成 MySQL数据库的连接池&#xff1a;由一个线程来监听一个连接上请求以及读取请求数据&#xff0c;解析出来一条我们发送过去的SQL语句SQL接口&#xff1a;负责处理接收到的SQL语句查询解析器&#xff1a;让MySQL能看懂SQL语句查询优化器&#xff1a;选择最优的查询…

OpenCV 图像重映射函数remap()实例详解

OpenCV 图像重映射函数remap()对图像应用通用几何变换。其原型如下&#xff1a; void remap(InputArray src, OutputArray dst, InputArray map1, InputArray map2, int interpolation&#xff0c; int borderMode BORDER_CONSTANT&#xff0c; const Scalar & borde…

LeetCode 189.轮转数组

题目&#xff1a;给定一个整数数组 nums&#xff0c;将数组中的元素向右轮转 k 个位置&#xff0c;其中 k 是非负数。 思路&#xff1a; 代码&#xff1a; class Solution {public void rotate(int[] nums, int k) {int n nums.length;k k % n;reverse(nums, 0, n);revers…

吴恩达deeplearning.ai:使用多个决策树随机森林

以下内容有任何不理解可以翻看我之前的博客哦&#xff1a;吴恩达deeplearning.ai专栏 文章目录 为什么要使用树集合使用多个决策树(Tree Ensemble)有放回抽样随机森林XGBoost(eXtream Gradient Boosting)XGBoost的库实现何时使用决策树决策树和树集合神经网络 使用单个决策树的…

Spark-Scala语言实战(2)(在IDEA中安装Scala,超详细配图)

之前的文章中&#xff0c;我们学习了如何在windows下下载及使用Scala&#xff0c;但那对一个真正想深入学习Scala的人来说&#xff0c;是不够的&#xff0c;今天我会给大家带来如何在IDEA中安装Scala。同时&#xff0c;希望我的文章能帮助到你&#xff0c;如果觉得我的文章写的…

Javaweb--CSS

一&#xff1a;概述 CSS &#xff08;Cascading Style Sheet&#xff08;层叠样式表&#xff09;&#xff09;是一门语言&#xff0c;用于控制网页表现。 W3C标准规定了网页是由以下组成&#xff1a; 结构&#xff1a;HTML 表现&#xff1a;CSS 行为&#xff1a;JavaScrip…

分布式文件存储与数据缓存(一)| FastDFS

目录 分布式文件系统FastDFS概述_简介FastDFS特性&#xff1a;分布式文件服务提供商 FastDFS概述_核心概念trackerstorageclientgroup FastDFS概述_上传机制内部机制如下 FastDFS概述_下载机制内部机制如下 FastDFS环境搭建_Linux下载安装gcc下载安装FastDFS下载安装FastDFS依赖…

sqllab第二十五A关通关笔记

知识点&#xff1a; 数值型注入双写绕过 oorranand这里不能用错误注入&#xff08;固定错误回显信息&#xff09;联合注入 测试发现跟25关好像一样&#xff0c;就是过滤了and or # 等东西 构造payload:id1/0 发现成功运算了&#xff0c;这是一个数值型的注入 构造payload:id…

音频的录制及播放

在终端安装好pip install pyaudio&#xff0c;在pycharm中敲入录音的代码&#xff0c;然后点击运行可以在10s内进行录音&#xff0c;录音后的音频会保存在与录音代码同一路径项目中&#xff0c;然后再新建项目敲入播放的代码&#xff0c;点击运行&#xff0c;会把录入的录音进行…