什么是 GPU（图形处理器）？

2025 年 4 月 29 日 | 阅读 12 分钟

GPU 是 图形处理器 (Graphics Processing Unit) 的缩写。GPU 也称为视频卡或显卡。为了显示图像、视频以及 2D 或 3D 动画，每台设备都使用 GPU。GPU 执行快速的算术计算，并使 CPU 可以处理其他任务。GPU 拥有许多较小的核心，这些核心专为多任务处理而设计，而 CPU 则主要基于串行处理使用少数几个核心。在计算领域，图形处理技术已经发展到提供特定优势。现代 GPU 为 内容创作、机器学习、游戏 等领域带来了新的可能性。

What is a GPU (Graphical Processing Unit)

GPU 做什么？

在 20 世纪 90 年代，当芯片制造商 Nvidia 创造了这个词时，GPU 成为了驱动系统图形的部件的通用术语。该公司的 GeForce 系列显卡首次得到普及，并确保了相关技术，包括可编程着色、硬件加速和流处理。

虽然渲染简单对象（如操作系统桌面环境）通常可以由 CPU 中内置的图形处理的有限灵活性来处理。额外的负载需要具有专用 GPU 的额外计算能力。对于个人和商业系统而言，图形处理器 (GPU) 是最重要的计算技术类型。GPU 专为并行处理而设计，并用于各种应用，包括视频渲染和图形。

最初，GPU 是为了加速 3D 图形渲染而设计的。随着时间的推移，它们变得越来越模块化和可编程，从而提高了其功能。它使图形程序员能够使用着色技术和高级照明来创建更令人兴奋的视觉效果和更逼真的场景。其他开发人员也开始利用 GPU 的强大功能进行高性能计算、深度学习等，以显著加快额外的计算速度。

为什么使用 GPU？

GPU 通常用于驱动 高质量游戏体验、创造逼真的超流畅渲染 和 图形设计。然而，也有许多业务应用依赖于强大的图形芯片。如今，GPU 比以往任何时候都更具可编程性，这使其有可能加速各种超越传统图形渲染的应用。我们可以使用 GPU 的各种应用。

用于游戏的 GPU

视频游戏在计算方面变得越来越密集，拥有庞大且超逼真的复杂游戏内世界。随着 4K 显示器和高刷新率等新技术以及虚拟现实游戏的发展，图形处理需求迅速增加。游戏可以以更好的分辨率、更好的帧率或具有高级图形性能来玩。

用于机器学习的 GPU

人工智能和机器学习为 GPU 技术提供了许多令人兴奋的软件包。由于 GPU 拥有卓越的计算能力，它们可以在利用 GPU 高度并行设计的计算密集型任务（如图像识别）中提供巨大的加速。许多先进的学习技术都依赖于 GPU 与 CPU 的结合。

用于视频编辑和内容创作的 GPU

多年来，视频编辑、图形设计师和其他专业人士在视频编辑和内容创作方面花费了大量时间，这占用了系统资源并扼杀了创造力。现在，GPU 的并行处理使得渲染更高质量格式的视频和图形变得更容易、更快速。此外，现代 GPU 具有特定的媒体和显示引擎，有助于视频制作和播放更节能。

用于科学计算的 GPU

天气预报、流体力学、天体物理学、分子建模，甚至量子力学都需要解决复杂的方程和模拟。过去，在高性能 CPU 或超级计算机上并行计算此类任务是可能的，但系统需要几天到几周才能完成。GPU 的引入彻底改变了许多研究人员和工程师的工作，由于 GPU 的线程处理能力，生产力得到了显著提高。

转移到 GPU 进行的数学计算使原本需要数小时的工作能在几分钟内完成。这种加速改变了实时模拟和快速迭代周期的可能性，促进了创新和对科学领域的更深入理解。例如，在气候建模中，研究人员正在努力实现对环境交互进行更详细的模拟。在天体物理学中，关于星系形成以及与黑洞相互作用的模拟现在比以前更精确。

用于加密货币挖矿的 GPU

加密货币的挖矿方案是 GPU 证明有用的另一个领域。加密货币挖矿包括解决复杂的数学问题，以验证特定区块链网络中的用户交易。工作量证明 (Proof-of-Work) 过程计算量很大，它会奖励矿工新生成的加密货币。

GPU 因其能够同时运行大量计算而成为挖矿以太坊等加密货币的首选硬件。其并行结构允许一次进行多次哈希运算，从而增加了解决问题并获得奖励的机会。虽然像专用集成电路 (ASIC) 这样的其他专用挖矿设备已经取代了比特币挖矿，但 GPU 仍然广泛用于许多山寨币。

数据中心和云计算中的 GPU

随着云计算的发展和大型数据中心的可用性，GPU 已成为服务提供商的关键组成部分。谷歌、亚马逊、微软和 IBM 等提供云服务的行业领导者使用 GPU 来提高 AI、机器学习、数据分析甚至 3D 建模的性能。

云中的 GPU 使组织和开发人员能够访问高性能计算，而无需昂贵的硬件。用户可以使用 GPU 实例来训练深度学习模型、处理大数据和执行高级模拟。此外，虚拟化的使用允许多个用户共享单个 GPU，从而提高了资源利用率并降低了成本。

GPU 架构概述

图形处理器 (GPU) 具有独特的效率机制，能够处理多维数据，并且是极其强大的并行处理器。与具有少量强大核心以顺序执行多项计算的中央处理器 (CPU) 不同，GPU 配备了数千个轻量级且更简单的核心，每个核心都能同时单独处理数据块。因此，GPU 最适合科学计算、人工智能技术、机器学习、复杂的图形渲染等。

GPU 的组成部分

GPU 有几个关键组成部分，如下所示：

1) CUDA 核心 / 流处理器

这些代表 GPU 内部分区和分配内存的基本单位。流处理器，或 NVIDIA 和 AMD 所称的 CUDA 核心，负责处理所有形式的算术和逻辑运算，以及轻量级数据绕行和预处理。多个处理器的部署使得可以同时执行繁重的计算，从而提高了需要大量资源的任务的效率。

2) VRAM（显存）

用于显卡的专用内存，并存储重要信息，如纹理、几何数据、帧缓冲区、显示器等。如今的计算机配备的 GPU 通常装有 GDDR6 甚至 HBM2 高速内存，以实现快速数据访问渲染。

3) SM（流式多处理器）

这些代表 GPU 级别的子级 CUDA 核心组织。每个 SM 都有能力并行运行多个线程，包括执行和数据流控制。所有 SM 都设计为适合 GPU 的架构，可以同时执行极大量的线程。

4) Tensor Core（NVIDIA）/ Matrix Core（AMD）

这些更确切地说是矩阵乘法专用核心，它们提高了矩阵运算的速度，而矩阵运算是神经网络的基本运算之一。它们在张量计算方面效率很高，为 AI 和深度学习应用提供了大量加速。

5) 图形管线

这是将三维模型转换为显示在监视器上的二维图像的顺序过程。重要步骤包括顶点着色、曲面细分、光栅化、片段着色和输出混合。

6) 显示引擎

这些部分控制图像的输出，并将 GPU 连接到屏幕。它们还促进了流畅的渲染，并支持高分辨率和高刷新率。

集成 GPU 和独立 GPU 的区别

GPU 主要有两种类型：集成式和独立式。每种类型都有不同的用途，具体取决于它们的性能要求、功耗和价格。

集成 GPU

内置于 CPU 的同一芯片中：集成 GPU 是处理器的一部分，因此共享相同的硅片。
与 CPU 共享内存：这些类型的 GPU 与 CPU 一起辅助处理，因此与 CPU 共享内存。
功耗较低：鉴于其外形尺寸和较低的功耗，其能量输出较少。集成 GPU 由于其紧凑的设计和较低的性能输出而消耗更多能量。
常见于大多数笔记本电脑和入门级台式机：在大多数笔记本电脑和入门级台式机上都可以找到的 GPU 类型：像入门级笔记本电脑和台式机这样的日常使用设备由于其便携性，通常配备集成显卡。
适用于基本的图形任务，如网页浏览、视频播放和轻度游戏：集成 GPU 适用于基本的图形任务，如浏览网页、观看视频和玩不太密集的电子游戏。

独立 GPU

具有独立 VRAM 的独立硬件组件：独立 GPU 附带自己的 VRAM，使其成为提高性能的独立显卡。
功能更强大，能够处理密集的图形和计算工作负载：独立 GPU 负责处理高性能任务和大型并行处理，这些处理在独立架构上进行。
常见于游戏 PC、工作站和高性能笔记本电脑：工作站和高性能笔记本电脑等设备需要高级图形功能，因此大多数此类系统都包含独立 GPU。
对于 3D 渲染、视频编辑和 AI 训练等任务是必需的：此类 GPU 提供专业和创意活动所需的计算能力。

每种类型的 GPU 都满足特定的需求，同时在性能、价格和能耗方面具有优势和劣势。虽然独立 GPU 需要独立性来实现高级图形，但集成 GPU 很容易适应程序。

GPU 技术和功能

如今的 GPU 包含了大多数与性能、图形和高效计算相关的尖端技术。这些技术对于游戏、专业内容开发或其他专业工作流程至关重要。

1. 光线追踪

这是一种渲染方法，可将光照、阴影和反射精度提升到全新的真实感水平。光线在虚拟对象和世界中传播并与之交互，从而增强了软件设计和游戏中的图形。NVIDIA 的 RTX 系列和 AMD 的 RDNA2 和 RDNA3 架构支持硬件加速光线追踪。

2. DLSS（深度学习超级采样）

在实时图形渲染中，NVIDIA 驱动的 DLSS AI 技术将低分辨率图像提升为高分辨率帧。因此，游戏可以以更高的 FPS 运行，并且在保持预期的同时，图像质量不会受到牺牲。RTX GPU 配备 Tensor Core，并通过 DLSS 实现最高的性能和清晰度。

3. FidelityFX 超分辨率 (FSR)

AMD FidelityFX Super Resolution 是一种空间放大技术，可在保持可接受的图像质量的同时提高游戏帧率。它比 DLSS 的范围更广，因为 FSR 不依赖于 AI 硬件，这意味着它可以在更广泛的 GPU 上运行，包括旧型号和 NVIDIA 卡。

4. Vulkan 和 DirectX

开发人员可以利用 Vulkan 和 DirectX 等图形 API（应用程序编程接口）使可编程 GPU 硬件与软件进行交互。Vulkan 以能够实现极快的速度和多线程使用而闻名，因此最适合现代硬件。至于 DirectX 12，它非常普遍，并且存在于 Windows 设置/环境中，为游戏和多媒体应用提供最先进的渲染功能。

5. G-Sync（NVIDIA）和 FreeSync（AMD）

这些技术通过根据 GPU 发送的信息速率调整屏幕刷新率来限制屏幕“撕裂”和卡顿。G-Sync 兼容 NVIDIA 显卡和认证显示器，FreeSync 兼容 AMD 显卡，但与前者不同的是，它适用范围更广，并且在显示器上被认为更简单。

选择合适的 GPU

确定最适合您的 GPU 取决于您的偏好、需求以及手头任务的性质，这些可能会有所不同。以下是一些常见活动的示例及其推荐的 GPU

用例	推荐 GPU 类型
日常浏览和视频	集成 GPU（Intel UHD、AMD Radeon Graphics）
AAA 游戏	中高端独立 GPU（例如，RTX 4060/4070、RX 7700）
专业视频编辑	NVIDIA RTX Studio 卡、AMD Radeon Pro
机器学习	NVIDIA RTX 30/40 系列、Tesla、AMD Instinct
3D 渲染	NVIDIA Quadro、RTX A 系列
入门级游戏	入门级独立 GPU（例如，GTX 1650、RX 6500）

针对特定任务和工作负载量身定制的性能可提供更好的生产力和价值，就像休闲用户和专业用户一样。但是，如果用户打算稍后使用更密集的应用程序，则应相应地设想系统功能。

GPU 散热和电源要求

中高端 GPU 用户使用的运行范围需要大量的系统资源开销和性能，同时产生大量热量并消耗电力。为了保持效率，必须维持足够的散热和功率水平，不仅要确保系统稳定性，还要优化生命周期价值。

冷却解决方案

空气冷却：大多数用户将拥有的标准解决方案是内置空气冷却，这是可以接受的。基础空气冷却采用 CPU 风扇和排气扇，以及散热器，用于标准使用和游戏时的过热缓解。
液体冷却：与空气冷却相比，液体冷却更有效，因为它通过泵、散热器和冷却剂将热量从 GPU 移走。此硬件适用于定制 PC 或高端游戏笔记本电脑，用于进行长时间渲染任务，甚至专门用于挖矿机。
被动冷却：仅使用散热器，没有风扇。它很安静，但不太适合仅使用低功瓦特 GPU 的基本系统。

电源

请务必确认您的 PC 的电源单元 (PSU) 能够满足 GPU 的电源要求。这意味着瓦数和连接器（如 6 针或 8 针 PCIe 电源线）必须合适。功率不足可能导致系统崩溃或硬件故障。

GPU 的未来

GPU 的演变仍在继续。一些正在进行中的进展包括：

AI 驱动的 GPU：用于自然语言处理、图像合成甚至视频超分辨率的专用 AI 核心。
更小的节点尺寸：5nm 及以下的制造工艺可带来更好的性能和效率。
多 GPU 架构：使用 NVIDIA NVLink 或 AMD Infinity Fabric 等技术，可以利用多个 GPU 来提高性能。
与 CPU 的更好集成：通过 AMD 的 APU 和 Intel 即将推出的统一架构更有效地结合 GPU 和 CPU 的功能。
云游戏：NVIDIA GeForce Now 和 Xbox Cloud Gaming 等服务无需本地强大的 GPU 即可实现高性能游戏。
可持续性：从区域到全球范围，旨在减少设备（例如加热器）的能源使用或提高热效率的尝试。

常见问题解答 - 图形处理器 (GPU)

1. GPU 和 CPU 有什么区别？

GPU（图形处理器）侧重于并行处理，具有针对图形渲染、AI 和科学计算的多任务处理功能，而 CPU（中央处理器）侧重于顺序处理、通用计算和特定领域的核心。CPU 在每核性能方面表现更好，而 GPU 则有数千个核心，针对多任务处理进行了优化。

2. 为什么 GPU 对游戏很重要？

GPU 在游戏中扮演着重要角色，因为显卡通过流式传输和其他高级效果（如光线追踪）来增强游戏，从而提供高帧率和 4K 图形与现实之间的平滑过渡。与集成显卡相比，GPU 的效率要高得多，并且能够应对现代游戏所需的巨大计算能力。

3. GPU 是否可用于游戏以外的任务？

当然！GPU 有无数的应用，极大地加速了机器学习、视频编辑、3D 建模、科学模拟和加密货币挖矿等任务。AI 训练、数据分析、天气预报以及执行天体物理学中的复杂计算，都是并行处理允许用户加速的众多复杂任务中的一小部分。

4. 集成 GPU 和独立 GPU 有什么区别？

网页浏览等基本任务仅需要集成 GPU，它们共享系统主板的内存并内置于 CPU 中。计算机的游戏功能，以及专业的平面设计工作和高性能计算，都需要称为独立 GPU 的独立组件，它们具有额外的 VRAM 并提供增强的性能。

5. 如何为我的需求选择合适的 GPU？

对于休闲用户来说，集成 GPU 就足够了。建议游戏玩家选择中高端选项，例如 NVIDIA RTX 40 系列和 AMD RX 7000 系列。AI 和 3D 渲染专业人士使用 NVIDIA Quadro 或 AMD Radeon Pro 等工作站 GPU 会更好。请记住检查所选 GPU 的功耗需求和散热系统。

下一主题什么是网卡（NIC）

我们提供所有技术（如 Java 教程、Android、Java 框架）的教程和面试问题

联系信息

G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India

hr@tpointtech.com

+91-9599086977

关注我们

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

电脑

历史与代际

计算机组件

计算机硬件

计算机软件

输入设备

输出设备

计算机内存

计算机网络

计算机病毒

数字系统

互联网

快捷键

条款

问题

选择题

面试题

其他

什么是 GPU（图形处理器）？

GPU 做什么？

为什么使用 GPU？

用于游戏的 GPU

用于机器学习的 GPU

用于视频编辑和内容创作的 GPU

用于科学计算的 GPU

用于加密货币挖矿的 GPU

数据中心和云计算中的 GPU

GPU 架构概述

GPU 的组成部分

集成 GPU 和独立 GPU 的区别

集成 GPU

独立 GPU

GPU 技术和功能

选择合适的 GPU

GPU 散热和电源要求

冷却解决方案

电源

GPU 的未来

常见问题解答 - 图形处理器 (GPU)

相关帖子

固态硬盘 (SSD)

网络接口卡 (NIC)

只读存储器 (ROM)

硬盘驱动器 (HDD)

RAM 和 ROM 的区别

随机存取存储器 (RAM)

什么是主板？

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器