R 二进制文件

2025年3月17日 | 阅读 3 分钟

二进制文件是一个仅以位和字节(0 和 1)形式包含信息的的文件。它们不是人类可读的,因为字节被转换为包含许多其他不可打印字符的字符和符号。如果我们使用任何文本编辑器读取二进制文件,它将显示诸如 ð 和 Ø 之类的字符。

将二进制数据读入 R 的代码相对来说非常容易。要读取二进制数据,我们必须知道信息是如何被解析成二进制的。

二进制文件必须由特定程序读取才能使用。例如,Microsoft Word 程序的二进制文件只能由 Word 程序以人类可读的形式读取。这表明,除了人类可读的文本之外,还有很多信息,例如字符格式和页码等,也与字母数字字符一起存储。最后,二进制文件是一系列连续的字节。我们在文本文件中看到的换行符是将第一行连接到下一行的字符。

有时,其他程序生成的数据需要由 R 作为二进制文件处理。此外,R 需要创建可以与其他程序共享的二进制文件。R 中有两个函数 writeBin() 和 readBin() 用于创建和读取二进制文件。

R Binary File

写入二进制文件

与 CSV 和 Excel 文件一样,我们也可以写入二进制文件。R 提供了 writeBin() 函数,用于将数据写入二进制文件。以下是 writeBin() 函数的语法

此处,

  • “?con” 是用于写入二进制文件的连接对象。
  • “?object” 是我们写入数据的二进制文件。

让我们看一个例子来理解如何使用此函数以二进制格式将数据写入文件。在下面的示例中,我们将使用 R 内置数据 "mtcars"。我们将从中创建一个 CSV 文件并将其转换为二进制文件。

示例

输出

R Binary File
R Binary File

读取二进制文件

我们还可以读取之前创建的二进制文件。为此,R 提供了 readBin() 函数,用于从二进制文件读取数据。

以下是 readbin() 函数的语法

此处,

  • “?con” 是用于读取二进制文件的连接对象。
  • “?what” 是诸如字符、整数等模式,表示要读取的字节。
  • “?n” 是我们要从二进制文件中读取的字节数。

让我们看一个例子,其中我们从 binary.bin 文件中读取二进制数据。

示例

输出

R Binary File
下一个主题R JSON 文件