DeepSeek 的思维链提示

2025年5月11日 | 阅读 6 分钟

引言

我们都知道,人工智能 (AI) 和使用 LLM 作为其模型的自然语言处理的引入,极大地改善了我们解释和提示的方式。然而,这些 LLM 缺乏复杂推理的能力,无法解释它是如何以及为何给出这个答案或结果。因此,思维链 (CoT) 作为一种新的提示技术被引入这些 LLM 模型中,用于解释这些复杂的任务和结果,从而提高这些 LLM 的推理能力。

DeepSeek 近期得到广泛应用,它能够更好地解释一切,甚至包括错误,因为 DeepSeek 已将 CoT 技术集成到其模型中,使其成为深度研究和分析的最佳选择。我们将研究它是如何工作的,为什么它优于其他提示方法,它的优点、缺点和应用。

Chain-of-Thought Prompting with DeepSeek

思维链提示

思维链提示是一种技术/方法,它将生成结果的整个过程分解成小部分,然后提供对该结果更深入的分析和更好的理解。它不直接给出输出;它还给出如何以及为何给出这个输出的原因。在算术问题、深度研究、分析推理等方面非常有用,需要了解结果是如何生成的背景原因。

示例

标准提示

问题:“如果我从同一高度,例如 10 米处,扔下一个重 200 克的回旋球和一个羽毛,哪一个会先落地(考虑到空气阻力)?”

答案:“球会先到达。”

CoT 提示

问题:问题:“如果我从同一高度,例如 10 米处,扔下一个重 200 克的回旋球和一个羽毛,哪一个会先落地(考虑到空气阻力)?”

答案:球会先到达地面,因为羽毛(重量很轻)相对于其重量会受到更大的空气阻力,因此会非常缓慢地落下,而重 200 克的球相对于其重量受到的空气阻力较小,遵循空气动力学原理,比羽毛落下得更快。

Chain-of-Thought Prompting with DeepSeek

CoT 与标准提示方法之间的区别

标准提示

  1. 所有解决方案和结果都直接生成,而无需解释为什么生成此答案以及如何生成此答案。
  2. 它缺乏透明度,隐藏了如何生成此答案的背景思考过程。
  3. 它对简单的任务来说很好,但当我们要求复杂任务的解决方案时,它会产生错误。
  4. 这是一种更快的提示方式,因为它直接给出答案,而没有任何分步推理。

CoT 提示

  1. 它提供了对生成答案的推理的分步细分,解释了答案是如何生成的。
  2. 它不会隐藏任何工作流程和深度思考以及解决方案查找方法,并与我们分享了结果查找过程。
  3. 在用于深度分析和研究、批判性思维和逻辑推理以及算术计算时非常有效。
  4. 与标准提示相比,它的速度较慢,因为它提供了推理和对答案的更深入的细分。

CoT 提示的类型

DeepSeek 使用三种 CoT 策略/方法:

1. 零样本 CoT

  • 在此模型中,我们提供一个问题,但没有如何期望答案的示例,模型会逐步思考,并为我们提供推理和答案。
  • 在给出最终答案之前,它还会提供分步推理,并且易于实现,但有时会产生不一致的推理,因为我们没有为其提供任何指导。

2. 少样本 CoT

  • 在此模型中,我们提供一个问题以及如何期望答案推理的示例(超过 2 个),然后模型从我们提供的示例中学习推理模式,并根据该模式给出结果,与我们给出的示例相同。
  • 它需要结构良好的推理示例作为先决条件,并且其准确性和效率也高于零样本 CoT。

3. 自我一致性 CoT

  • 此模型为单个问题提供多个结果和推理方式,然后选择最一致、最频繁的答案作为最终结果或答案。
  • 它对单个路径中的错误推理方法非常有效,并且可以减少 CoT 产生的错误。但与其他 CoT 类型相比,它的成本非常高。

使用 CoT 提示的流程

1. 模型架构改进

  • 首先,DeepSeek 中使用的这些 AI 模型 在需要详细思考的数据集上进行训练,例如逻辑推理、分析和算术问题解决。
  • 接下来,DeepSeek 使用强化学习 (RL),这是一种在 AI 模型遵循正确推理路径时对其进行奖励的技术。
  • 最后,这些 AI 模型具有自我检查功能,可以检查它们的推理或分步解释是否存在任何错误或任何类型的错误,这使得这些模型更准确、更可靠,并减少了出错的可能性。

2. 训练方法

为了以后能够分步提供推理,这些 AI 模型需要经过适当的训练过程。

  • 首先,这些模型使用高度准确、无错误、高质量、可靠的数据集进行训练。
  • 然后,这些 AI 模型使用特殊的提示,例如“让我们一步一步地思考”,这有助于考虑解决给定问题背后原因的推理,而不仅仅是解决方案。
  • 然后,最后,一些人工评审员会检查这些推理过程,找出错误。

3. 性能结果

根据准确性结果,DeepSeek 使用的 CoT 提示方法比标准提示好得多。

优点

  1. 它在多步问题中使用分步推理过程,与标准提示相比,准确性更高。
  2. 由于它提供了用户可以审计推理过程并更改其提供推理方式的选项,这使得 AI 模型在工作时更加透明和可靠。
  3. 我们研究的少样本 CoT 类型允许 DeepSeek 模型通过有限的数据输入(作为学习和训练的数据集)来泛化答案和推理过程,从而得到类似准确的结果。
  4. 它在 AI 应用的所有领域都表现出良好的适应性。
Chain-of-Thought Prompting with DeepSeek

挑战或局限性

  1. 由于 CoT 的资源优化非常高,因此分步生成推理过程需要非常高的处理能力,并且还会占用系统过多的内存。
  2. 在使用如此多的处理器处理能力时,成本也会增加。
  3. 在训练 AI 模型以提高性能的数据集时,如果我们使用有偏见的数据集,那么 CoT 将继承这些有偏见的数据集,然后随后提供该有偏见训练数据集的原因,这会违反技术并导致解决方案过程中的问题。
  4. 存在一些需要非封闭、开放式推理的问题。

应用

1. 教育

CoT 方法用于解决数学问题。也广泛用于解决编程代码,使错误查找和纠正过程变得容易。

2. 医疗保健

当 AI 用于诊断问题或疾病时,它会提供包括症状、健康问题原因和治疗过程在内的适当解决方案,从而使医生更容易做出决策。

3. 业务/财务分析

通过使用 DeepSeek 等 AI 模型,对市场趋势、公司财务和风险的分析可以帮助投资者和企业主据此制定策略。

4. 研究

CoT 的最佳应用体现在研究领域,其中可以看到 DeepSeek 的推理和深度研究。

结论

思维链提示 (CoT) 技术是 AI 模型领域的一项重大创新和集成,它将 AI 模型的推理过程提升到了一个新的水平,从而提高了对解决方案过程背后机制的深度研究和理解水平。DeepSeek 这种类人问题解决和推理技能提高了 DeepSeek AI 模型的准确性、效率、可理解性、透明度和可靠性。随着时间的推移,CoT 领域将会有更多进步和改进,这将塑造 AI 驱动的问题解决和推理过程的未来。