机器学习中的贝叶斯网络

2025年6月17日 | 阅读时长8分钟

贝叶斯网络是一种概率图模型,它使用有向无环图 (DAG) 表示变量集之间的条件依赖关系。图的每个节点代表一个随机变量,而边则表示这些随机变量之间的条件依赖关系。贝叶斯网络在机器学习领域中被广泛使用,因为它能够在不确定性下进行推理,并提供联合概率分布的高效表示和计算。

在建模复杂变量关系时,有时即使数据部分缺失,也可以针对本项目描述贝叶斯网络,它允许以依赖关系的形式表示紧凑性,将图论和概率论结合起来。在医疗诊断系统这样的情况下,贝叶斯网络可以建模疾病、测试结果和症状之间存在的关系,从而可以根据观察到的症状预测某种疾病的可能性。

贝叶斯网络在机器学习中的应用具有优势,因为它们可以包含先验知识并在新数据到来时更新信念。这个贝叶斯定理允许它根据证据修正其概率。因此,贝叶斯网络非常适合用于决策系统、异常检测、自然语言处理和推荐系统等应用。

构建贝叶斯网络需要定义 DAG 的结构,为每个节点指定条件概率表,然后执行推理。贝叶斯网络中的推理用于在给定其他变量证据的情况下计算某些变量的后验概率。执行此操作的算法包括变量消除、信念传播或马尔可夫链蒙特卡洛 (MCMC) 等采样方法。

现在我们将使用贝叶斯网络来检测异常。

导入库

加载数据集

输出

Bayesian Network in Machine Learning

EDA

输出

Bayesian Network in Machine Learning

输出

Bayesian Network in Machine Learning

让我们看看特征的重要性。

输出

Bayesian Network in Machine Learning
Bayesian Network in Machine Learning

在重叠区域之间存在模糊区域的情况下,三种葡萄酒可以清楚地区分开来。

输出

Bayesian Network in Machine Learning

为了避免过拟合,我们将数据集进行分割。

输出

Bayesian Network in Machine Learning

该报告将检查基线模型并找出其缺点。

输出

Bayesian Network in Machine Learning

输出

Bayesian Network in Machine Learning

输出

Bayesian Network in Machine Learning
Bayesian Network in Machine Learning

贝叶斯网络

权重向量将服从具有可训练参数的正态后验分布,以及均值为 0 且方差为 1 的正态先验分布。

输出

Bayesian Network in Machine Learning
Bayesian Network in Machine Learning