数据挖掘系统分类

2025年3月17日 | 阅读 3 分钟

数据挖掘是指从原始数据中提取重要数据的过程。它借助多种软件分析大数据集中数据模式。自数据挖掘发展以来,研究人员一直在研究和开发领域中使用它。

通过数据挖掘,企业可以获得更多利润。它不仅有助于理解客户需求,还有助于制定有效的策略以促进整体业务周转。它有助于确定业务目标,以便做出明确的决策。

数据收集和数据仓库以及计算机处理是数据挖掘的一些最强支柱。数据挖掘利用数学算法的概念来分割数据并评估未来事件发生的可能性。

为了理解系统并满足所需的要求,数据挖掘可以分为以下系统:

Classification of Data Mining Systems
  • 基于挖掘数据库的分类
  • 基于挖掘知识类型的分类
  • 基于统计的分类
  • 基于机器学习的分类
  • 基于可视化的分类
  • 基于信息科学的分类
  • 基于所用技术的分类
  • 基于已采用应用的分类

基于挖掘数据库的分类

数据挖掘系统可以根据已挖掘的数据库类型进行分类。数据库系统可以根据不同的原则进一步细分,例如数据模型、数据类型等,这有助于进一步对数据挖掘系统进行分类。

例如,如果我们想根据数据模型对数据库进行分类,我们需要选择关系型、事务型、对象-关系型或数据仓库挖掘系统。

基于挖掘知识类型的分类

根据挖掘知识类型的分类数据挖掘系统可能具有以下功能:

  1. 特征描述
  2. 判别
  3. 关联和相关性分析
  4. 分类
  5. 预报
  6. 异常值分析
  7. 演变分析

基于所用技术的分类

数据挖掘系统也可以根据所采用的技术类型进行分类。这些技术可以根据用户交互的参与程度或所采用的分析方法进行评估。

基于已采用应用的分类

根据已采用的应用进行分类的数据挖掘系统如下:

  1. 融资
  2. 电信
  3. DNA
  4. 股票市场
  5. 电子邮件

分类任务示例

以下是一些分类任务的主要示例:

  • 分类有助于确定肿瘤细胞是良性还是恶性。
  • 将信用卡交易分类为欺诈性或合法的。
  • 将蛋白质的二级结构分类为α-螺旋、β-折叠或无规卷曲。
  • 将新闻报道分类为不同的类别,例如金融、天气、娱乐、体育等。

数据库和数据仓库系统的集成方案

Classification of Data Mining Systems

无耦合

在无耦合方案中,数据挖掘系统不使用任何数据库或数据仓库系统功能。

松散耦合

在松耦合中,数据挖掘利用一些数据库或数据仓库系统功能。它主要从这些系统管理的数据存储库中获取数据,然后执行数据挖掘。结果保存在文件或数据库或数据仓库中的任何指定位置。

半紧耦合

在半紧耦合中,数据挖掘与 DB 或 DW 系统连接,并在数据库中提供数据挖掘原语的有效实现。

紧耦合

数据挖掘系统可以轻松地与数据库或数据仓库系统紧密耦合结合。


下一主题数据挖掘模型