R 箱线图

2025年3月17日 | 阅读 3 分钟

箱线图衡量数据在数据集中的分布情况。它将数据集分成三个四分位数。此图表示数据集中的最小值、最大值、平均值、第一个四分位数和第三个四分位数。箱线图也可用于通过为每个数据集绘制箱线图来比较数据在数据集中的分布情况。

R 提供了 boxplot() 函数来创建箱线图。以下是 boxplot() 函数的语法

此处,

序号参数描述
1.x它是一个向量或一个公式。
2.数据它是数据框。
3.notch它是一个逻辑值,设置为 true 以绘制一个凹口。
4.varwidth它也是一个逻辑值,设置为 true 以绘制与样本大小相同的箱子宽度。
5.names这是一组标签,将在每个箱线图下打印。
6.main它用于为图形提供标题。

让我们看一个例子来了解如何在 R 中创建箱线图。在下面的例子中,我们将使用 R 环境中现有的“mtcars”数据集。我们将仅使用它的两列,即“mpg”和“cyl”。下面的例子将创建一个箱线图,用于表示 mpg 和 cyl 之间的关系,即每加仑英里数和气缸数。

示例

输出

R Boxplot

使用凹口的箱线图

在 R 中,我们可以使用凹口绘制箱线图。它有助于我们找出不同数据组的中位数如何相互匹配。让我们看一个例子来了解如何使用每个组的凹口创建箱线图。

在我们的下面的例子中,我们将使用相同的数据集“mtcars”。

示例

输出

R Boxplot

小提琴图

R 提供了一个额外的绘图方案,它是通过结合箱线图核密度图创建的。小提琴图是借助 vioplot 包中存在的 vioplot() 函数创建的。

让我们看一个例子来了解小提琴图的创建。

示例

输出

R Boxplot

Bagplot - 二维箱线图扩展

aplpack 包中的 bagplot(x, y) 函数提供了单变量箱线图的两年期版本。包包含所有点的 50%。双变量中位数是近似值。围栏将自身与外部点分开,并显示异常值。

让我们看一个例子来了解如何在 R 中创建二维箱线图扩展。

示例

输出

R Boxplot
下一主题R 直方图