数据挖掘有哪些问题?
1515人已读
发布于:2023-02-07 22:41:16
展开目录
展开目录收起
1、分类问题
2、聚类问题
3、预测问题
4、关联问题
数据挖掘主要有四个问题:1、分类问题; 2、聚类问题 ;3、预测问题; 4、关联问题。数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标

数据挖掘的几个问题?

1、分类问题

       解决分类问题的主要思路:首先对收集到的变量进行分析,找出其与目标变量的相关特征,并筛选出两者间的联系。大前提是通过对历史数据的收集,明确了具体的分类项目、用户的分类结果。分类技术在很多领域都有应用,市场营销中十分注重对客户的细分,针对客户的特点,将他们分为不同的类别。这样不仅可以找出不同类型客户的特征,同样可以进一步了解不同行为类别客户的分布特征。

2、聚类问题

       顾名思义,聚类即“物以类聚”,按照不同的对象,划分若干不同的问题。聚类问题的核心是其划分的依据,经过处理后的同一类对象相似度较高,不同的对象则具有较低的相似度。聚类的方法各种各样,常常用距离、密度来度量不同对象的相似度。目前,最流行的聚类划分方法是基于用户间的距离长短来划分。分类问题与聚类问题常常被混淆,但二者有着本质的区别。分类问题属于预测性问题,通常用来预测一个未知类别的用户属于哪个类别,而聚类问题则是已经明确了特定的用户,对一群用户进行划分,不属于预测问题。因此在进行聚类之前,首先应确定选择哪些指标来对用户进行聚类。

3、预测问题

       数据挖掘中的预测问题通过对历史数据的统计和学习得到预测模型(通过机器学习建立),再利用此模型对未来的输入输出值进行预测。预测问题多采用统计学技术解决,如回归分析和时间序列分析等。回归分析的主要目的是用来研究目标变量和影响它的相关变量间的关系,用于解决预测问题的回归分析和关联分析不同,它较少应用于商业中,更多地应用于自然科学、医学、心理学等。

4、关联问题

       关联分析是在各类数据挖掘算法中比较重要的一种,关联规则与聚类算法一样,属于无监督学习方法。它在许多实际业务中都有应用,最广泛的应用便是在超市中,因此也叫作“购物篮分析(Market Basket Analysis)” 。解决关联问题时分析的重点是研究用户同一次**的产品间的相关性,若**的产品时间不同,则可以分析出时间先后上的关联性,“啤酒与尿布”是其中一个著名的案例。

让数据流动起来,开启业绩增长!

了解500+品牌零售商使用LinkFlow的场景用例