机器学习中的假设2025年06月20日 | 阅读 5 分钟 假设(Hypothesis)是机器学习和数据科学项目中一个常见的术语。我们知道,机器学习是当今世界上最强大的技术之一,它帮助我们根据过去的经验来预测结果。此外,数据科学家和机器学习专业人士会进行旨在解决问题的实验。这些机器学习专业人士和数据科学家会为问题的解决方案提出初步的假设。 在机器学习中,这种假设被称为假设。在机器学习中,假设和模型经常可以互换使用。然而,假设是科学家提出的一个假设,而模型是用于检验假设的数学表示。在本主题“机器学习中的假设”中,我们将讨论与机器学习中假设相关的几个重要概念及其重要性。所以,让我们从对假设的简要介绍开始。 什么是假设?假设被定义为基于证据不足或假设的推测或拟议解释。 它仅仅是基于一些已知事实的猜测,但尚未被证明。一个好的假设是可以检验的,其结果要么为真,要么为假。 示例:让我们通过一个常见的例子来理解假设。一些科学家声称紫外线(UV)会损害眼睛,然后可能还会导致失明。 在这个例子中,科学家只是声称紫外线对眼睛有害,但我们假设它们可能导致失明。然而,这可能是也可能不是真的。因此,这类假设被称为假设。 机器学习(ML)中的假设假设是机器学习中统计学的一个常用概念。它尤其用于监督机器学习,其中机器学习模型通过可用数据集学习一个函数,该函数能最好地将输入映射到相应的输出。 ![]() 在监督学习技术中,主要目标是从假设空间中确定一个可能的假设,该假设能最好地将输入映射到相应的或正确的输出。 有一些常见的方法可以从假设空间中找出可能的假设,其中假设空间用大写字母 H 表示,假设用小写字母 h 表示。定义如下: 假设空间 (H)假设空间被定义为所有可能的合法假设的集合;因此,它也被称为假设集。 监督机器学习算法使用它来确定最好的可能假设来描述目标函数或最佳映射输入到输出。 它通常受问题框架选择、模型选择和模型配置选择的限制。 假设 (h)它被定义为监督机器学习算法中最好地描述目标的近似函数。 它主要基于数据以及应用于数据的偏差和限制。 因此,可以得出假设(h)是映射输入到正确输出的单个假设,可以对其进行评估并用于进行预测。 在机器学习中,假设(h)可以表述如下: y= mx + b 其中, Y:范围 m:分割测试数据的斜率,或者 y 的变化量除以 x 的变化量。 x:域 c:截距(常数) 示例:让我们通过一个二维坐标系来理解假设(h)和假设空间(H),该坐标系显示了数据分布如下: ![]() 现在,假设我们有一些测试数据,机器学习算法会根据这些数据预测输出,如下所示: ![]() 如果我们以一种可以帮助您预测输出或结果的方式来划分这个坐标平面,如下所示: ![]() 基于给定的测试数据,输出结果如下: ![]() 然而,根据数据、算法和约束,这个坐标平面也可以以以下方式进行划分: ![]() 通过上面的例子,我们可以得出以下结论: 假设空间(H)是由所有合法的、最佳的划分坐标平面的方式组成的,以便它能最好地将输入映射到正确的输出。 此外,每种单独的最佳划分方式都称为一个假设(h)。因此,假设和假设空间将如下所示: ![]() 统计学中的假设与机器学习中的假设类似,它也被认为是输出的假设。然而,它是可证伪的,这意味着在有足够证据的情况下,它可以被否定。 与机器学习不同,我们不能在统计学中接受任何假设,因为它只是一个虚构的结果,并且基于概率。在开始进行实验之前,我们必须了解两种重要的假设类型,如下所示:
显著性水平显著性水平是在开始实验之前必须设置的主要内容。它有助于定义误差的容忍度以及可以将效应视为显著的水平。在实验的测试过程中,接受 95% 的显著性水平,其余 5% 可以忽略。显著性水平还告诉我们临界值或阈值。例如,在一个实验中,如果显著性水平设置为 98%,则临界值为 0.02%。 P 值在统计学中,P 值被定义为反对零假设的证据。换句话说,P 值是在零假设条件下,随机机会生成数据的概率,或者生成与此相等或更罕见结果的概率。 P 值越小,证据越强,反之亦然,这意味着在检验中可以拒绝零假设。它总是以小数形式表示,例如 0.035。 每当对总体和样本进行统计检验以找出 P 值时,它总是取决于临界值。如果 P 值小于临界值,则表明效应是显著的,并且可以拒绝零假设。反之,如果 P 值大于临界值,则表明没有显著效应,因此无法拒绝零假设。 结论在监督机器学习中,将输入映射到输出的实例序列中,假设是一个非常有用的概念,它有助于近似机器学习中的目标函数。它存在于所有分析领域,也被认为是判断是否应引入变更的重要因素之一。它涵盖了整个训练数据集的效率以及模型的性能。 因此,在本主题中,我们涵盖了与机器学习和统计学中的假设相关的各种重要概念,以及 P 值、显著性水平等重要参数,以便更好地理解假设概念。 下一个主题理解梯度裁剪 |
我们请求您订阅我们的新闻通讯以获取最新更新。