机器学习中的解析解

2025年2月3日 | 阅读10分钟

机器学习是一个通过从数据中发现模式和进行预测而蓬勃发展的领域;从这个意义上说,它通常以更实证的方式进行。虽然大多数机器学习技术严重依赖数值方法和近似值来解决复杂问题,但仍有一部分问题存在解析解,可以通过直接从相关的数学方程推导得出,而无需迭代算法或大量的计算。理解机器学习中的解析解可以深入了解该领域的数学基础,并有助于在更传统的统计方法与当今更现代的计算方法之间建立桥梁。

至于解析解,它表示一个封闭形式的表达式,它内在地上解决了数学问题。与数值解不同,数值解是通过迭代方法执行的引导和近似过程的结果,解析解在有限的步骤内给出结果。在机器学习的背景下,解析解通常是从一个明确定义的数学模型推导出来的,从而揭示了变量之间真实的内在关系。

机器学习中解析解的应用

我们可以通过多种方式找到解析解,例如:

  • 线性回归:机器学习中最著名的经典解析解之一是线性回归。线性回归模型的作用是识别最佳拟合线,以保持预测值与真实值之间的最小差异。对于给定的输入特征数据集 X 和目标变量 y,正规方程推导给出了线性回归方程系数 θ 的解析解。其中,β 是系数向量,X 是输入特征矩阵,y 是目标变量。该方程精确地给出了参数的解,无需任何形式的迭代,例如在梯度下降等方法中使用的。
  • 主成分分析 (PCA):主成分分析 (PCA) 是一种降维过程,通过该过程可以将任何数据集转换为较低维度的空间,同时保留最大方差。分析的解涉及计算 PCA 解的解析解的特征向量和特征值。然后求解与最大特征值对应的特征向量。然后,通过线性变换形成主成分,这不需要迭代优化,因此是解析解的一个例子。
  • 朴素贝叶斯分类器:朴素贝叶斯分类器基于贝叶斯定理,并且通常被迫做出独立性假设。尽管这是一个非常简单的假设,但对于每个类的后验概率,它都有一个解析解,即 $P(y|x) = \frac{P(x|y)P(y)}{P(x)}$。这反过来又可用于基于每个类的观察到的特征似然性对新数据点进行直接分类。
  • 精确性和可解释性:解析解提供精确的答案,这些答案可以高度可解释。例如在线性回归的情况下,可以通过正规方程获得的系数可以直接解释,以了解特征与目标变量之间的关系。
  • 计算效率:解析解不依赖于迭代过程,因此在收敛所需的迭代次数不是过高的但在效率方面非常高,特别是对于中小数据集。这在需要短时间内获得精确答案并且优化算法本身的开销可能很显著的问题中很重要。

导入库

我们需要一些配置值。

我们将在标点符号之前和之后用空格替换它们,以便进行分词或使文本数据准备好进行处理。

Analytical Solution in Machine Learning
Analytical Solution in Machine Learning

现在,我们将通过将原始文本转换为可用作模型输入(特别是对于基于神经网络的方法)的格式,来为机器学习管道准备文本数据。

现在,让我们将这些预训练的词嵌入链接到机器学习模型中;特别是,这对于 NLP 任务很有用。这使得模型能够利用关于单词含义及其相互关系的先验知识,从而在训练期间获得更好的性能并实现更快的收敛。

CNN 模型

此 CNN 专门设计用于二元文本分类任务。在此模型中,卷积层用于从文本中的不同 n-gram 中提取特征,然后对这些特征进行最大池化和全连接层处理,以预测二元输出(例如,问题是真诚的还是不是)。它使用预训练的嵌入来帮助模型初始化,使其对单词语义有良好的理解,从而提高性能和收敛性。

注意力层

基本上,注意力层根据学习到的注意力分数计算输入项的加权和,从而使模型能够专注于与任务相关的序列部分。特别是在自然语言处理等任务中,在执行某些任务时,并非所有单词都同等重要。

LSTM

它专为序列数据上的二元分类问题而设计,例如,句子的情感或问题是否真诚。另一方面,双向 LSTM 层从序列的两个方向提取上下文信息,并且注意力机制帮助模型专注于序列中最有信息量的部分,这实际上可以提高最终预测。

GRU 层可以捕获序列中的时间依赖关系,而添加的注意力机制使模型能够仅关注序列中与提高分类数据准确性相关的部分。

使用双向 GRU 结合全局池化,可以组合有关长期依赖关系和序列最重要特征的信息并进行预测。

由于这是一个堆叠了多个双向 GRU 层并应用了注意力机制的堆叠,因此可以学习复杂的模式,并且输入序列中的关键信息将获得更大的权重,从而提高预测性能。

训练和预测


输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning

输出

Analytical Solution in Machine Learning