如何使用 Pickle 在 Python 中保存和加载变量？

2025年1月5日 | 阅读6分钟

引言

Python 作为一种功能最强大、用途最广泛的编程语言之一，提供了大量的工具和库来满足各种活动的需求。事实上，用于长期保存数据的常用模块之一就是 pickle。'pickle' 能够将 Python 对象转换为可序列化的数据，从而有效地保存和检索变量。本详细指南将探讨 Pickle 中保存变量的方方面面。

理解 Pickle

什么是 Pickle？

'Pickle' 是一个 Python 模块，允许 **序列化和反序列化 Python 对象**。序列化是将 Python 对象转换为数据流的过程，而反序列化则是将该字节流转换回其原始表示形式。Pickle 可以处理所有类型的 Python 对象，包括自定义类和函数。

为什么要使用 Pickle？

Pickle 因多种原因而被广泛使用：

持久性： Pickle 允许您将 Python 对象的当前状态写入文件并在以后检索它们。
跨平台兼容性： 在不同平台和 Python 版本上生成的 pickle 文件很容易移动。因此，它是一种流行的数据交换方式。
灵活性： Pickle 不限于原始数据类型；它可以处理复杂对象、自定义类等。

分步过程

当然！以下是如何使用 Pickle 在 Python 中保存和加载变量的分步过程：

步骤 1：导入 Pickle 模块。

第一步是导入 **'pickle' 模块**，它允许将 Python 对象序列化和反序列化。

步骤 2：使用 Pickle 保存变量。

2.1 选择要保存的数据

选择要保存的变量或数据结构。例如，我们将字典作为我们的示例数据集。

2.2 二进制写入模式

使用 **'open()'** 函数以二进制写入模式 ('wb') 打开文件。这一点很重要，因为 Pickle 处理的是二进制数据。

2.3 使用 'pickle.dump()' 存储数据

使用 **pickle.dump()** 函数通过序列化将数据持久化到打开的文件中。

2.4 关闭文件

请记住在保存数据后关闭文件。

# Inside the 'with' block
# ...
# Outside the 'with' block

步骤 3：使用 Pickle 加载变量。

3.1：以二进制读取模式打开 Pickle 文件

使用 **'open()'** 函数以二进制读取模式，即 **二进制读取 ('rb')** 打开 Pickle 文件。

3.2 通过 pickle.load() 加载数据

调用 **pickle.load()** 函数来反序列化并从打开的文件中读取数据。

3.3 关闭文件

在加载数据后，确保关闭文件。

# Inside the 'with' block
# ...
# Outside the 'with' block

代码实现

import pickle

# Function to save variables using Pickle
def save_variables(data, filename):
    try:
        # Open a file in binary write mode
        with open(filename,'wb') as file:
            # Use dump() to serialize and save the data
            pickle.dump(data, file)
        print(f"Variables saved successfully to {filename}")
    except Exception as e:
        print(f"Error saving variables: {e}")

# Function to load variables using Pickle
def load_variables(filename):
    try:
        # Open the Pickle file in binary read mode
        with open(filename,'rb') as file:
            # Use load() to deserialize and load the data
            loaded_data = pickle.load(file)
        print(f"Variables loaded successfully from {filename}")
        return loaded_data
    except Exception as e:
        print(f"Error loading variables: {e}")
        return None

# Example: Saving and Loading Simple Data
data_to_save={'name':'John','age':30,'city':'New York'}
save_variables(data_to_save, 'data.pickle')

loaded_data = load_variables('data.pickle')
print("Loaded Data:", loaded_data)
print()

# Example: Saving and Loading Custom Class Instances
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age

# Creating an instance of the custom class
person_instance = Person(name='Alice', age=25)
save_variables(person_instance, 'person.pickle')

loaded_person = load_variables('person.pickle')
if loaded_person:
    print("Loaded Person:", loaded_person.name, loaded_person.age)
print()

# Example: Saving and Loading Multiple Objects
data1={'name':'Alice','age':28}
data2=[1,2,3,4,5]

save_variables(data1, 'multi_data.pickle')
save_variables(data2, 'multi_data.pickle')

loaded_data1 = load_variables('multi_data.pickle')
loaded_data2 = load_variables('multi_data.pickle')

print("Loaded Data 1:", loaded_data1)
print("Loaded Data 2:", loaded_data2)

输出

Variables saved successfully to data.pickle
Variables loaded successfully from data.pickle
Loaded Data: {'name': 'John', 'age': 30, 'city': 'New York'}

Variables saved successfully to person.pickle
Variables loaded successfully from person.pickle
Loaded Person: Alice 25

Variables saved successfully to multi_data.pickle
Variables saved successfully to multi_data.pickle
Variables loaded successfully from multi_data.pickle
Variables loaded successfully from multi_data.pickle
Loaded Data 1: [1, 2, 3, 4, 5]
Loaded Data 2: [1, 2, 3, 4, 5]

说明

提供的 Python 代码是 Pickle 模块的一个示例，展示了如何保存和恢复变量。该脚本包含两个函数：**'save_variables'** 和 **'load_variables'**。
'save_variables' 函数接受两个参数：**'data'（一个要进行 pickle 的 Python 对象）和 'filename'（要保存数据的文件名）**。在 try-except 块内，该函数使用 **'pickle.dump()'** 以二进制写入模式打开指定的文件来序列化和保存数据。如果成功，将打印一条保存成功的消息；否则，将出现一条错误消息。
'load_variables' 函数仅接受一个参数，filename，表示要加载的 Pickle 文件。在 try-except 块内，该函数以二进制读取模式打开文件，并使用 **'pickle.load()'** 从中反序列化和加载数据。如果一切顺利，将打印一条成功消息并返回加载的数据；否则，将发生错误，并返回 **None**。
该脚本展示了如何保存和加载简单数据（以字典形式）、自定义类实例（使用名为 'Person' 的类）以及多个对象。每种情况都涉及调用相应的保存和加载函数。为了进行验证，会打印加载的数据。该脚本演示了 Pickle 在存储 Python 对象方面的灵活性，这使得简单的数据存储和检索成为可能。

在讨论使用 Pickle 保存和加载 Python 变量的用途时，至关重要的是要遵循最佳实践，并在执行此操作之前考虑某些因素。

最佳实践和注意事项

1. 安全注意事项

不受信任的来源： 请注意不要从不受信任的来源加载 Pickle 文件，因为 pickle 库可以在反序列化过程中执行任意代码。这构成了安全隐患，加载来自未经验证的 Pickle 文件的内容可能会导致代码执行漏洞。
安全加载： 如果您需要从外部来源加载 Pickle 文件，请尝试使用单独的、受限的环境或额外的安全措施来限制风险。

2. 版本兼容性

Python 版本兼容性： Pickle 文件可能无法在不同的 Python 版本之间移植。在系统或用户之间传递 Pickle 文件时，请确保考虑所使用的 Python 版本。如果兼容性至关重要，则可以考虑使用具有更强跨版本支持的替代序列化格式或库。

3. Pickle 的替代方案

用例考虑： 虽然 Pickle 在大多数情况下都能很好地工作，但并非所有应用程序都适用。然而，可以使用 JSON 或 YAML 等替代序列化格式来实现更易读的格式、与其他语言的互操作性以及更好的性能。
性能考虑： 对于大型数据集或高性能要求，Pickle 可能效率不高。但是，对于这些类型的案例，请研究其他序列化库或面向性能的数据库。

4. 代码可维护性

类定义： 在序列化和反序列化自定义类实例时，请确保在两个操作期间都存在这些类的定义。这使得对象重构更加准确。
代码文档： 记录已保存变量的目标、预期数据值以及关于这些信息的任何先验知识。这些文档对于代码审查或其他人参与项目时将非常有用。

5. 错误处理

健壮的错误处理： 确保您的保存和加载函数足够健壮，可以处理任何错误！以用户友好的方式处理文件操作、序列化和反序列化过程中可能出现的异常，以避免程序突然终止。

6. 版本控制

数据版本控制： 如果您的应用程序的数据模式随时间而变化，您可能还需要对已保存的数据进行版本控制。这有助于在代码演进时平稳地处理不断变化的数据结构。
测试和验证： 在生产环境中部署基于 Pickle 的数据持久性之前，请确保使用各种数据集彻底测试保存和加载功能。验证加载的数据是否与预期结果匹配且未损坏。

通过遵循这些最佳实践和建议，使用 Pickle 可以帮助您克服潜在的安全问题，同时在 Python 项目中保持兼容性和有效的数据持久性机制。

结论

本详细指南介绍了在 Python 中使用 Pickle 保存或加载变量的“是”与“否”。Pickle 允许将 Python 对象存储起来以供以后使用，从而加快了过程并使其更加便捷。尽管如此，在使用 Pickle 时，记住安全问题、版本兼容性和性能方面仍然很重要。通过利用最佳实践以及在需要时使用替代方案，您可以就如何在 Python 项目中使用 Pickle 做出明智的决定。

下一个主题Python 实现中国剩余定理

← 上一个下一个 →

如何使用 Pickle 在 Python 中保存和加载变量？

引言

理解 Pickle

什么是 Pickle？

为什么要使用 Pickle？

分步过程

步骤 1：导入 Pickle 模块。

步骤 2：使用 Pickle 保存变量。

步骤 3：使用 Pickle 加载变量。

代码实现

最佳实践和注意事项

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

其他

如何使用 Pickle 在 Python 中保存和加载变量？

引言

理解 Pickle

什么是 Pickle？

为什么要使用 Pickle？

分步过程

步骤 1：导入 Pickle 模块。

步骤 2：使用 Pickle 保存变量。

步骤 3：使用 Pickle 加载变量。

代码实现

最佳实践和注意事项

结论

相关帖子

Python中的区间树

Python中两个数相加的算法

使用Python检测未知语言

Python中局部变量和全局变量的区别

Python中的并行化

如何在Python中为数字添加前导零

Python写入Parquet的4种方法：比较

Python情感分析入门指南

如何在Python中使用while True

Python中的并发 - 进程池

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器