R CSV 文件

17 Mar 2025 | 4 分钟阅读

逗号分隔值 (CSV) 文件是一个包含数据列表的纯文本文件。 这些文件通常用于不同应用程序之间的数据交换。 例如,数据库和联系人管理器主要支持 CSV 文件。

这些文件有时可以称为字符分隔值逗号分隔文件。 它们通常使用逗号字符来分隔数据,但有时使用其他字符,例如分号。 我们的想法是将复杂的数据从一个应用程序导出到 CSV 文件,然后将 CSV 文件中的数据导入到另一个应用程序。

将数据存储在 Excel 电子表格中是数据存储最常见的方式,数据科学家经常使用这种方式。 R 中有很多包专门用于访问 Excel 电子表格中的数据。 用户通常发现将电子表格保存为逗号分隔值文件更容易,然后使用 R 的内置功能来读取和操作数据。

R 允许我们从 R 环境之外存储的文件中读取数据。 让我们开始了解如何将数据读写到 CSV 文件中。 文件应存在于当前工作目录中,以便 R 可以读取它。 我们还可以设置我们的目录并从那里读取文件。

R CSV Files

获取和设置工作目录

在 R 中,getwd() 和 setwd() 是两个有用的函数。 getwd() 函数用于检查 R 工作区指向哪个目录。 setwd() 函数用于设置一个新的工作目录,以便从该目录读取和写入文件。

让我们看一个例子来了解如何使用 getwd() 和 setwd() 函数。

示例

输出

R CSV Files

创建 CSV 文件

逗号分隔列中值的文本文件称为 CSV 文件。 让我们从创建 CSV 文件开始,借助以下数据,使用记事本中的“另存为所有文件(*.*)”选项,以 .csv 扩展名保存。

示例:record.csv

输出

R CSV Files

读取 CSV 文件

R 具有丰富的功能集。 R 提供了 read.csv() 函数,它允许我们读取当前工作目录中可用的 CSV 文件。 此函数将文件名作为输入,并返回其中存在的所有记录。

让我们使用我们的 record.csv 文件,使用 read.csv() 函数从中读取记录。

示例

当我们执行上面的代码时,它会给出以下输出

输出

R CSV Files

分析 CSV 文件

当我们使用 read.csv() 函数从 .csv 文件读取数据时,默认情况下,它将输出作为数据帧。 在分析数据之前,让我们首先借助 is.data.frame() 函数检查输出的形式。 之后,我们将借助 nrow()ncol() 函数检查行数和列数。

示例

当我们运行上面的代码时,它将生成以下输出

输出

R CSV Files

从上面的输出可以清楚地看出,我们的数据是以数据帧的形式读取的。 因此,我们可以应用我们在前面章节中讨论的所有数据帧函数。

R CSV Files

示例:获取最大工资

输出

R CSV Files

示例:获取拥有最高工资的人的详细信息

输出

R CSV Files

示例:获取在 IT 部门工作的所有人的详细信息

输出

R CSV Files

示例:获取工资大于 600 且在 IT 部门工作的人员的详细信息。

输出

R CSV Files

示例:获取 2014 年或之后加入的人员的详细信息。

输出

R CSV Files

写入 CSV 文件

与读取和分析一样,R 也允许我们写入 .csv 文件。 为此,R 提供了 write.csv() 函数。 此函数从现有数据帧创建 CSV 文件。 此函数在当前工作目录中创建文件。

让我们看一个例子来了解如何使用 write.csv() 函数来创建输出 CSV 文件。

示例

输出

R CSV Files
下一个主题R Excel 文件