为 DeepSeek 设置环境（Python、CUDA 等）

2025年5月27日 | 6分钟阅读

Setting Up the Environment (Python, CUDA, etc.) for DeepSeek

在当今世界，人工智能技术的应用以及人工智能模型在各种应用中的集成已不再是新鲜事，而是变得非常普遍，甚至是必需的。随着时间的推移，所有机构、组织或公司都需要在其领域内进行改进，为此它们需要响应迅速、可扩展且经济高效的人工智能解决方案，而像DeepSeek这样强大的人工智能模型就能提供这些解决方案。

引言

DeepSeek是一个开源的大型语言模型，它旨在用于多种目的，并在创意内容创作、深度研究与分析、自然语言处理应用、聊天机器人集成、代码生成等方面具有多功能性。在本文中，您将了解在本地服务器上高效运行所需的工具和依赖项（包括Python、CUDA和其他重要软件包）的设置步骤。

系统要求和设置

为了确保安装过程顺利进行，您必须确保您的系统符合要求。

硬件要求

建议使用Intel i5、Intel i7或AMD Ryzen CPU以加快预处理速度。
RAM最低应为8GB，但为了方便安装和运行，建议使用16GB或更多RAM。
需要30GB以上的可用磁盘空间。这对于存储模型权重、库和数据集是必需的。
必须使用计算能力为6.0+的NVIDIA GPU（例如RTX 2060或更高版本）。

操作系统兼容性

需要Windows 10、Windows 11或macOS（仅适用于CPU设置）。
但强烈建议使用Ubuntu（18.04/20.04/22.04）。

Python 安装

Python可以轻松处理所有基本操作，包括模型加载、模型权重处理、数据处理和推理。因此，DeepSeek主要使用Python 3.8或更高版本。

在 Ubuntu 上安装

terminal

sudo apt update
sudo apt install python3.10 python3.10-venv python3.10-dev python3-pip  

Windows 上的安装

首先，从官方网站下载Python 3.10。安装过程中，勾选“Add Python to PATH”。
现在，使用pip安装Python包。安装完成后，验证安装。

验证方法

terminal

python3 --version
pip3 --version

设置虚拟环境

虚拟环境会隔离项目特定的软件包，从而防止依赖冲突。

创建和激活环境

terminal

python3 -m venvdeepseek-env
source deepseek-env/bin/activate # On Linux/macOS
.\deepseek-env\Scripts\activate # On Windows   

安装CUDA和cuDNN（用于GPU支持）

必须正确安装CUDA和cuDNN，以便DeepSeek可以利用GPU来加速推理和训练。

步骤1：访问NVIDIA的CUDA GPU页面检查GPU兼容性，在那里找到您GPU的计算能力；确保它至少为6.0+。

步骤2：安装NVIDIA驱动程序并确保其为最新版本

terminal

sudo ubuntu-drivers devices
sudo ubuntu-drivers autoinstall  

步骤3：安装Cuda Toolkit - Ubuntu（例如：CUDA 11.8）

terminal

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-repo-ubuntu2004-11-8-local_11.8.0-*.deb
sudodpkg -i cuda-repo-ubuntu2004-11-8-local_*.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-8-local/*.pub
sudo apt update
sudo apt install cuda

Windows

从NVIDIA CUDA Toolkit下载CUDA安装程序，然后按照屏幕上的说明进行操作。

步骤4：安装cuDNN

访问cuDNN下载页面（需要登录），然后选择与您的CUDA版本兼容的版本。
解压并将include和lib文件复制到您的CUDA目录中。

terminal

sudo cp -P cuda/include/* /usr/local/cuda/include/
sudo cp -P cuda/lib64/* /usr/local/cuda/lib64/ 

步骤5：现在更新环境变量，添加到~/.bashrc:

terminal

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
source ~/.bashrc  

最后，验证CUDA安装。

terminal

nvcc --version
nvidia-smi   

安装带有CUDA支持的Pytorch

PyTorch为DeepSeek提供深度学习后端支持。

步骤1：安装PyTorch。

访问此链接以获取安装过程的概述和说明

https://pytorch.ac.cn/get-started/locally/

示例（CUDA 11.8）

terminal

pip install torch torchvisiontorchaudio --index-urlhttps://download.pytorch.org/whl/cu118   

步骤2：验证GPU使用情况

Python

import torch
print(torch.cuda.is_available()) # Should return True  

安装DeepSeek及其依赖项

您需要根据您的用例安装一个DeepSeek模型（基础DeepSeek模型、DeepSeek-LLM、DeepSeek-Coder）。

如果您有自己的私有存储库，或者DeepSeek是开源的，则克隆GitHub存储库。

terminal

git clone https://github.com/deepseek-ai/deepseek.git
cd deepseek   

安装所需的Python库。

几乎所有DeepSeek环境都使用requirement.txt文件

terminal

pip install -r requirements.txt   

如果不可用，您可以手动安装通用依赖项。

terminal

pip install transformers accelerate left sentence piece torch torchvisiontqdm   

下载模型权重

使用Hugging Face CLI

安装CLI：pip install huggingface_hub
登录（如果需要）：hugging face-cli login
下载模型：from huggingface_hub import snapshot_downloadsnapshot_download(repo_id="deepseek-ai/deepseek-llm-7b-base", local_dir="deepseek-model")

如果您想增强开发过程，可以使用这些工具。（此增强是可选的）

Jupyter Notebook：最适合交互式模型测试、调试和可视化
VS Code：为了获得无缝的开发体验，请安装VS Code并添加Python和Jupyter扩展。
Weights and Biases：用于实验跟踪 -

terminal

pip install wandb
wandb login  

优化环境

混合精度训练/推理以避免性能问题。通过PyTorch启用。

Python

with torch.cuda.amp.autocast():
    output = model(input)   

内存管理技巧

推理时使用torch.no_grad()。
清除内存时，使用del和torch.cuda.empty_cache()
正确使用batch_size和max_length限制。

故障排除

问题1：torch.cuda.is_available() = False

解决方案1：您需要检查CUDA安装、驱动程序版本，甚至GPU硬件。

问题2：推理过程中出现MemoryError

解决方案2：通过梯度检查点和使用更小的批次大小

问题3：性能缓慢

解决方案3：通过启用混合精度或检查CPU瓶颈来提高性能

问题4：ModuleNotFoundError

解决方案4：使用pip install -r requirements.txt重新安装

Docker设置（此设置是可选的/非必需的）

如果您希望在整个系统中使用一致的环境，请使用Docker。

示例文件看起来像这样

Dockerfile

FROM nvidia/cuda:11.8.0-cudnn8-runtime-ubuntu20.04
RUN apt update && apt install -y python3.10 python3-pip git
RUN pip3 install torch torchvision transformers accelerate
WORKDIR /workspace
COPY . /workspace   

使用此命令构建然后运行

terminal

docker build -t deepseek-env .
docker run --gpus all -it deepseek-env   

结论

设置一个优化的DeepSeek环境的整个过程涉及多个阶段和一个结构化的方法。首先从安装Python和CUDA开始，然后是配置具有GPU支持的PyTorch，最后是下载所有重要的模型权重。无论是在云平台还是本地运行，每一步都确保兼容性并最大化性能。因此，通过选择正确的依赖项版本（如支持CUDA的PyTorch），开发人员可以充分利用GPU加速来加快训练和推理速度。

在完成基本设置后，您现在可以调整性能，通过调整批次大小、启用混合精度训练和使用高效的注意力机制来显著提高效率。此外，为了帮助消除瓶颈，您可以使用NVIDIA Nsight或Pytorch Profiler等监控工具；这确保了资源的适当利用。一旦配置得当，该环境就能通过实现用于内容生成、代码生成、文本摘要、代码翻译和研究的高性能AI代理和应用程序来展现DeepSeek的全部潜力。使用DeepSeek的开发人员可以对其进行微调，通过一些量化技术优化推理速度，并根据其用例将DeepSeek集成到特定用途的应用程序中。此外，使用Docker等工具进行容器化有助于使部署过程更加简化和可扩展。

因此，通过本文的介绍，您将了解到，借助强大的开发环境，DeepSeek已成为增强AI的强大而高效的工具，无论是在研究、企业应用还是开源项目中使用。通过在整个过程中遵循最佳实践，开发人员和用户可以充分利用这些大型语言模型，达到目前难以想象的程度。

下一主题Deepseek-r-1-model-its-types-whats-new-and-how-it-is-better-than-openai-and-google

为 DeepSeek 设置环境（Python、CUDA 等）

引言

系统要求和设置

硬件要求

操作系统兼容性

Python 安装

在 Ubuntu 上安装

Windows 上的安装

验证方法

设置虚拟环境

创建和激活环境

安装CUDA和cuDNN（用于GPU支持）

Windows

安装带有CUDA支持的Pytorch

安装DeepSeek及其依赖项

安装所需的Python库。

下载模型权重

优化环境

内存管理技巧

故障排除

Docker设置（此设置是可选的/非必需的）

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

DeepSeek 教程

为 DeepSeek 设置环境（Python、CUDA 等）

引言

系统要求和设置

硬件要求

操作系统兼容性

Python 安装

在 Ubuntu 上安装

Windows 上的安装

验证方法

设置虚拟环境

创建和激活环境

安装CUDA和cuDNN（用于GPU支持）

Windows

安装带有CUDA支持的Pytorch

安装DeepSeek及其依赖项

安装所需的Python库。

下载模型权重

优化环境

内存管理技巧

故障排除

Docker设置（此设置是可选的/非必需的）

结论

相关帖子

DeepSeek 中使用自定义数据集进行微调

使用 DeepSeek 的示例 API 调用（Python、JavaScript）

使用 DeepSeek 在云和边缘环境中部署

使用 DeepSeek 下载模型权重

在聊天机器人中使用 DeepSeek

DeepSeek-R1：其架构和创新的技术概述

使用 DeepSeek 评估模型性能

DeepSeek AI 法规的遵守

避免关于 DeepSeek 的幻觉和错误信息

DeepSeek 的模型偏差和道德使用

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器