分享

数据挖掘任务类型

 算法与编程之美 2021-09-17

引言

在大数据时代我们总有许许多的的数据要去挖掘分析。

问题描述

那么数据挖掘任务有哪些类型呢?我们该如何去判断进而去处理它呢?

方法

我们要认识到有以下四种类型:

1.预测建模(predictive modeling)

涉及以说明变量函数的方式为目标变量建立模型。有两类预测建模任务:分类(classification),用于预测离散的目标变量;回归(regression),用于预测连续目标变量。

例如:对一个地区的近几年各月份降雨量做统计,对其建模分析预测未来几年的降雨量,从而进行一些事情的开展。

2.关联分析(association analysis)

用来发现描述数据中强关联特征的模式。所发现的模式通常蕴含规则或特征子集的形式表示。(由于搜索空间是指数规模的,关联分析的目标是以有效的方式提取最有趣的模式。)

例如:对顾客购物篮所装物品的分析。对顾客的购物习惯进行分析,可以针对进行商品营销策略。最经典的就是啤酒与尿布的故事。

3.异常检测(anomaly detection)

是识别其特征显著不懂与其他数据的观测值。这样的观测值称为异常点(anomaly)或离群点(outlier)。异常检测算法的目标时发现真正的异常点,

而避免错误地将正常的对象标注为异常点。

例如:对于地震波的检测就属于异常点检测。

4.聚类分析(cluster analysis

旨在发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。

例如:对于多个单位的不同属性分析时就可以对相同的属性进行。

最简单的就是对去年我国不同城市的消费能力的分析。

结语

在这个数据复杂的时代我们可以掌握更多的技能,正所谓技多不压身嘛!

实习编辑:李欣容

稿件来源:深度学习与文旅应用实验室(DLETA)

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多