C 语言中使用 CSV 文件创建关系数据库

2025年1月7日 | 阅读13分钟

在 C 语言中，从 CSV 文件创建关系型数据库是一个多阶段的过程。首先，通过打开文件并逐行解析来读取 CSV 数据，提取相关信息。这涉及到使用像 fopen 这样的文件处理函数和 strtok 这样的 CSV 字段解析函数。

需要定义一个数据库模式来系统地组织数据。为此，C 语言中通常会使用 SQLite，它能够方便地创建表并指定列类型。模式定义了在数据库中存储 CSV 数据的蓝图。

定义完模式后，下一步是填充数据库。在处理 CSV 数据的每一行时，会动态构造 SQL 语句 将信息插入数据库。这个插入过程确保 CSV 数据按照定义的模式以结构化的方式存储。

为了妥善管理系统资源，关闭数据库连接至关重要。这种全面的方法可以将原始 CSV 数据转换为关系型数据库，从而能够在 C 程序中高效地存储、检索和管理结构化信息。

C 语言中读取 CSV 数据

从 CSV 文件 读取数据 是编程中的一项基本任务，尤其是在处理表格数据时。在 C 语言的上下文中，高效地读取 CSV 数据涉及一系列明确定义的步骤。这个有条理的过程包括打开 CSV 文件、逐行读取其内容、解析每一行以提取单个字段，然后用提取的信息填充数据结构。

在 C 语言中读取 CSV 数据涉及一个有条理的方法，包括 文件处理、数据提取、解析 和 结构化。这个有条理的过程确保了将原始 CSV 数据高效准确地转换为 C 程序中易于操作和利用的格式。结合错误处理实践可以进一步增强程序的 健壮性，并确保在数据读取过程中能够妥善处理意外情况。

打开 CSV 文件

读取 CSV 数据 的第一步是使用 fopen 函数打开相应的 CSV 文件。此函数返回一个文件指针 (FILE *)，这对于后续的文件操作至关重要。在继续之前，必须验证文件是否成功打开。一种常见的做法是使用 perror 函数进行 错误报告，并在文件无法打开时退出。

逐行读取 CSV 数据

文件成功打开后，程序会逐行读取其内容。这是通过 fgets 函数实现的，它从文件中读取一行文本。每一行通常对应 CSV 数据中的一行。读取过程一直持续到文件末尾。

解析 CSV 数据

解析涉及将每一行 CSV 分解为单独的字段。在 C 语言中，通常使用 strtok 函数。它允许根据指定的定界符（在 CSV 的情况下是逗号）对字符串进行标记。标记代表 CSV 行的单个字段。

填充数据结构

在从 CSV 行中提取标记后，下一步是用解析的信息填充数据结构。在提供的示例中，使用了 Person 结构，可以根据要处理的特定数据进行自定义。CSV 行中的每个字段对应于数据结构中的一个字段，并相应地分配值。

关闭文件

处理完整个 CSV 文件后，使用 fclose 函数关闭文件至关重要。此步骤可确保与文件关联的系统资源得到释放，从而避免潜在问题和资源泄漏。

错误处理

在整个过程中，结合健壮的错误处理机制对于程序的 可靠性 和 稳定性 至关重要。这包括检查文件是否成功打开、处理数据解析过程中可能出现的错误以及解决读取过程中可能出现的各种情况。

程序

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
// Define a data structure to hold CSV data
typedef struct {
 int id;
 char name[50];
 int age;
 // Add more fields as needed
} Person;
//function to read CSV data and populate the data structure
void readCSV(const char *filename) {
 // Open the CSV file
 FILE *file = fopen(filename, "r");
 if (file == NULL) {
 perror("Error opening file");
 exit(EXIT_FAILURE);
 }
 // Read CSV data line by line
 char line[1024];
 while (fgets(line, sizeof(line), file)) {
 // Parse the CSV line
 char *token = strtok(line, ",");
 if (token != NULL) {
 // Extract and process each token
 Person person;
 person.id = atoi(token); // Convert token to integer
 token = strtok(NULL, ",");
 strcpy(person.name, token);
 token = strtok(NULL, ",");
 person.age = atoi(token);
 // Add more fields as needed
 // Further processing or storage of 'person' data can be done here
 // For this example, let's print the extracted data
 printf("ID: %d, Name: %s, Age: %d\n", person.id, person.name, person.age);
 }
 }
 // Close the CSV file
 fclose(file);
}
int main() {
 // Specify the CSV file name
 const char *filename = "your_file.csv";
 // Read CSV data and populate the data structure
 readCSV(filename);
 return 0; 
}

输出

Error opening file: No such file or directory

说明

提供的 C 代码说明了读取 CSV 数据的全面方法，逐行分解了实现。

头文件包含： 代码首先包含必要的头文件，分别提供 标准输入/输出 和内存分配函数。它包含用于字符串处理函数的头文件。
Person 结构定义： 定义了一个 Person 结构来表示 CSV 文件中的单个记录。该结构包含 id、name 和 age 等字段。可根据 CSV 数据结构添加其他字段。
readCSV 函数： 定义了一个名为 readCSV 的函数，该函数接受文件名作为参数。此函数负责从指定文件读取 CSV 数据、解析数据并填充 Person 结构。
打开 CSV 文件： 在 readCSV 函数中，代码使用 fopen 函数打开 CSV 文件。此函数返回一个文件指针 (FILE *)，这是后续文件操作所必需的。使用 perror 函数进行错误报告，如果文件打开不成功，程序将退出。
逐行读取 CSV 数据： 程序使用一个循环和 fgets 函数逐行读取 CSV 文件。fgets 函数从文件中读取一行文本，每一行通常对应 CSV 文件中的一条记录。
解析 CSV 数据： 在循环内，代码使用 strtok 函数根据逗号 (,)（CSV 文件中的典型定界符）对每一行进行标记。strtok 返回指向行中第一个标记的指针，后续使用 NULL 的调用会检索下一个标记。此过程有效地将 CSV 行分解为单个字段。
填充 Person 结构： 提取的标记随后用于填充 Person 结构的字段。在此示例中，id 和 age 字段 使用 atoi 从字符串转换为整数，name 字段使用 strcpy 复制。此步骤创建了 CSV 数据的结构化表示。
进一步处理或存储： 代码包含一个占位符注释，表明此时可以执行 Person 数据的进一步处理或存储。在此示例中，数据使用 printf 打印到控制台。
关闭 CSV 文件： 处理完整个 CSV 文件后，使用 fclose 函数 关闭文件至关重要。这可确保正确的资源管理，防止潜在问题和资源泄漏。
main 函数： main 函数是程序执行开始的地方。它指定 CSV 文件名，然后调用 readCSV 函数执行实际的数据读取和处理。

复杂度分析

可以评估提供的 C 代码用于读取 CSV 数据的时空复杂度，以了解其效率和资源利用情况。

时间复杂度

代码的时间复杂度主要由读取和解析 CSV 文件的过程决定。

使用 fopen 打开 CSV 文件具有恒定的时间复杂度 (O(1))，因为它不依赖于文件大小。

使用 fgets 逐行读取 CSV 数据具有线性时间复杂度 (O(N))，其中 N 是文件中的行数。每一行都单独处理。

使用 strtok 解析 CSV 数据的时间复杂度为 O(M)，其中 M 是每行的平均标记数。此步骤包括根据逗号定界符对每一行进行标记。

使用提取的数据填充 Person 结构具有恒定的时间复杂度 (O(1))，因为字段的数量是固定的。使用 fclose 关闭 CSV 文件也具有恒定的时间复杂度 (O(1))。

考虑到这些因素，代码的总时间复杂度主要由线性读取和解析操作决定，结果为 O(N * M)，其中 N 是文件中的行数，M 是每行的平均标记数。

空间复杂度

空间复杂度受 CSV 数据处理期间使用的内存需求（数据结构和缓冲区）的影响。

Person 结构具有固定数量的字段，并产生恒定的空间复杂度 (O(1))。

fgets 使用的行缓冲区为每一行动态分配空间，导致空间复杂度为 O(L)，其中 L 是 CSV 文件中最长行的长度。

strtok 函数使用缓冲区来存储从 CSV 行中提取的每个标记，从而导致空间复杂度为 O(T)，其中 T 是最长行中的标记数。

考虑到这些因素，总空间复杂度由行和标记缓冲区所需的最高空间决定。因此，总空间复杂度为 O(max(L, T))，其中 L 是最长行的长度，T 是最长行中的标记数。

C 语言中写入 CSV 数据

为关系型数据库 写入 CSV 数据 包括一系列步骤，包括连接到数据库、执行查询、获取结果、将数据转换为 CSV 格式、写入 CSV 文件、关闭数据库连接、实施错误处理以及考虑优化和 自定义。实现的具体细节将取决于编程语言、数据库系统以及使用的库或框架。

为 关系型数据库 写入 CSV 数据涉及将数据库中的结构化数据转换为易于存储或共享的 CSV 格式。此过程通常用于将数据从数据库表导出到 CSV 文件。下面是涉及步骤的详细说明。

连接到数据库

使用适当的数据库连接库或 API 建立与关系型数据库的连接。这可能涉及提供数据库名称、用户名、密码和主机等连接详细信息。

执行查询

使用 SQL 查询 从数据库中所需的表检索数据。查询应选择感兴趣的列和行。检索到的数据是表格形式的，反映了数据库表的结构。

获取结果

执行查询并获取结果。根据使用的编程语言和数据库库，这可能涉及迭代结果集或使用其他机制来检索数据的行和列。

将数据转换为 CSV 格式

遍历获取的结果并将数据格式化为 CSV 格式。结果集中的每一行对应 CSV 文件中的一行，每个列值都用逗号分隔。应特别注意处理数据类型、转义特殊字符，并确保 CSV 符合预期格式。

写入 CSV 文件

使用适当的文件 I/O 函数打开一个新的或 现有的 CSV 文件 进行写入。对于结果集中的每一行，将一行写入 CSV 文件。确保数据格式正确，并处理在写入过程中可能发生的任何错误。

关闭数据库连接

成功将数据写入 CSV 文件后，关闭数据库连接。妥善的资源管理对于避免潜在问题和泄漏至关重要。

错误处理

在整个过程中实施健壮的错误处理机制。这包括检查数据库连接、查询执行和文件打开是否成功。如果出现错误，请提供有意义的错误消息以帮助进行调试和解决问题。

优化

考虑优化以提高性能，特别是对于大型数据集，可能涉及批量数据检索过程、优化查询效率或在适用时使用异步操作。

自定义和配置

允许 自定义 CSV 输出，例如指定 分隔符、处理特殊字符或选择一部分列。这可以通过配置文件参数或命令行选项来实现。

程序

#include <stdio.h>
#include <stdlib.h>
int main() {
 // Assume you have fetched data from a database
 int id[] = {1, 2, 3};
 char name[][50] = {"John", "Alice", "Bob"};
 double salary[] = {50000.0, 60000.0, 70000.0};
 // Open CSV file for writing
 FILE *csvFile = fopen("output.csv", "w");
 if (csvFile == NULL) {
 perror("Error opening file");
 exit(EXIT_FAILURE);
 }
 printf("File opened successfully.\n");
 // Write headers
 fprintf(csvFile, "ID,Name,Salary\n");
 // Write data
 for (int i = 0; i < 3; i++) {
 fprintf(csvFile, "%d,%s,%f\n", id[i], name[i], salary[i]);
 }
 printf("Data written to CSV file.\n");
 // Close CSV file
 fclose(csvFile);
 printf("File closed successfully.\n");
 return 0; 
}

输出

File opened successfully.
Data written to CSV file.
File closed successfully.

说明

提供的代码不仅演示了从 CSV 文件读取和提取数据的技术方面，还强调了 良好的编程 实践，例如错误处理和资源管理。理解和适应此代码对于需要在 C 应用程序中使用 CSV 数据的开发人员很有帮助。
提供的 C 代码全面说明了从 CSV（逗号分隔值） 文件中提取和打印数据的过程。让我们深入研究代码中每个组件的详细信息。

文件打开

代码通过使用 fopen 函数尝试打开 CSV 文件来启动。此函数返回一个文件指针 (FILE *)，这是后续文件操作所必需的。文件以只读模式 ("r") 打开。
集成了错误处理，以检查文件是否成功打开。如果在打开文件时出现问题，将使用 perror 函数显示错误消息，并通过 exit(EXIT_FAILURE) 以错误状态退出程序。

逐行读取 CSV 数据

文件 成功打开 后，程序将进入一个循环，使用 fgets 函数逐行读取 CSV 文件的内容。此函数从文件中读取一行文本，在 CSV 的上下文中，每一行通常代表一个记录。循环一直持续到文件末尾。

CSV 数据标记化

在读取循环内，使用 strtok 函数对每一行进行标记。此函数根据指定的定界符（在 CSV 文件中是逗号）将行分解为单独的字段 （标记）。
标记代表记录中的单个值。使用 strtok 可以有效地解析 CSV 数据，将每个字段隔离以供进一步处理。

打印或处理数据

标记化之后，代码提供了一个 可自定义 的部分，其中使用 printf 函数将每个标记（字段）打印到控制台。此步骤充当可视化工具，允许开发人员观察提取的数据。
此部分是可适应的，开发人员可以根据特定需求对其进行修改，例如以不同的方式处理数据或将其存储在其他数据结构中。

关闭 CSV 文件

处理完整个 CSV 文件后，必须使用 fclose 函数关闭文件。妥善关闭文件对于释放与文件相关的系统资源，防止潜在问题 和资源泄漏至关重要。
fclose 函数确保文件正确关闭，从而提高了代码的整体健壮性。

主函数

整个代码封装在 main 函数中，为 C 语言中从 CSV 文件读取和提取数据提供了一个结构化的模板。它包括文件处理、数据提取和可选的数据处理或可视化步骤。
开发人员可以利用此模板作为处理 C 语言中 CSV 数据的起点，并根据特定的项目需求进行进一步自定义。

复杂度分析

提供的 C 代码用于从 CSV 文件中提取和打印数据的时空复杂度可以进行分析，以了解其效率。

时间复杂度

文件打开： 用于打开 CSV 文件的 fopen 函数具有恒定的时间复杂度 (O(1))，因为它不依赖于文件的大小。

逐行读取 CSV 数据： fgets 函数单独读取每一行，导致线性时间复杂度 (O(N))，其中 N 是文件中的行数。

CSV 数据标记化： strtok 函数根据逗号定界符对每一行进行标记，时间复杂度为 O(M)，其中 M 是每行的平均标记数（字段数）。

打印或处理数据： 标记化循环中的 printf 函数对每个字段具有恒定的时间复杂度 (O(1))，但总体影响取决于每行中的字段数。

关闭 CSV 文件： 用于关闭文件的 fclose 函数具有恒定的时间复杂度 (O(1))。

考虑到这些因素，总时间复杂度主要由逐行线性读取和标记化过程决定。因此，总时间复杂度为 O(N * M)，其中 N 是文件中的行数，M 是每行的平均标记数。

空间复杂度

文件指针和缓冲区： 空间复杂度主要受 FILE * 指针和 fgets 使用的缓冲区所占用的内存需求的影响。两者都具有恒定的空间复杂度 (O(1))。

标记缓冲区： strtok 函数 使用一个缓冲区来存储从 CSV 行中提取的每个标记。所需的空间与行中的标记数成正比。因此，空间复杂度为 O(T)，其中 T 是行中的标记数。

考虑到这些因素，总空间复杂度由标记缓冲区所需的最高空间决定。因此，总空间复杂度为 O(T)，其中 T 是行中的最大标记数。

下一主题C 语言编程测试

C 语言中使用 CSV 文件创建关系数据库

C 语言中读取 CSV 数据

打开 CSV 文件

逐行读取 CSV 数据

解析 CSV 数据

填充数据结构

关闭文件

错误处理

程序

C 语言中写入 CSV 数据

连接到数据库

执行查询

获取结果

将数据转换为 CSV 格式

写入 CSV 文件

关闭数据库连接

错误处理

优化

自定义和配置

程序

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

C 语言教程

C 语言控制语句

C 语言函数

C 语言数组

C 语言指针

C 语言动态内存

C 语言字符串

C 语言数学

C 语言结构体和联合体

C 语言文件处理

C 语言预处理器

C 语言命令行

C 语言程序

C 语言面试

选择题

C 语言编程测试

C 语言基础测试

C 语言控制语句测试

C 语言函数测试

C 语言数组测试

C 语言指针测试

C 语言字符串测试

C 语言结构体测试

C 语言预处理器测试

数学

C 语言杂项

C 语言中使用 CSV 文件创建关系数据库

C 语言中读取 CSV 数据

打开 CSV 文件

逐行读取 CSV 数据

解析 CSV 数据

填充数据结构

关闭文件

错误处理

程序

C 语言中写入 CSV 数据

连接到数据库

执行查询

获取结果

将数据转换为 CSV 格式

写入 CSV 文件

关闭数据库连接

错误处理

优化

自定义和配置

程序

相关帖子

C 语言龙格-库塔法

C 语言正弦级数

C 语言 Keith 数

C 语言负数的模

C 语言最差适应算法

如何在 C 语言中打印双引号

C 语言 Kosaraju 算法

C 语言 fclose() 函数

C 语言单字母密码程序

C 语言计算矩阵的法向量和迹的程序

订阅 Tpoint Tech

联系信息

关注我们