一、从算法分析数据的方式划分
从算法分析数据的方式角度划分,可将数据挖掘算法划分为假设检验型算法和知识发现型算法。
1、假设检验型算法
也称自顶向下(Top-Down)型算法,该算法通常应首先提出某个理论假说,然后利用所收集的数据去证实假说。如果数据不能成分证实假说,则应拒绝假说,反之则不能拒绝假说。
因此,假设检验型算法的本质是一种从一般原理推出个别结论的验证型方法。
2、知识发现型算法
也称自底向上(Bottom-Up)型算法,该类算法一般不对数据和结论提出假设,而是通过对数据的分析发现数据中隐含的事先并不知道的规律。
二、从算法来自的学科类型划分
从算法来自的学科类型划分,可将数据挖掘算法划分为机器学习算法和统计学算法。机器学习和统计学本属于不同的学科领域,但两个领域专家们在某个算法上有类似的解决方案。知识发现型算法是一种从个别数据中归纳得出一般性结论的探索性分析方法。但由于这种分析方法的自身特点,使得一般性结论的推广要更慎重。
1、机器学习算法
机器学习算法的核心是通过对n维空间数据集的搜索,找到对数据特征的恰当概括。其本质任务是通过对有限的系统输入/输出分析,估计出输入/输出的相关性并进行分类预测,或揭示系统结构特征。
2、经典统计学方法
与机器学习思路有类似的方面,同时它更强调模型的先期假设和后期验证。
三、从算法所得结果的类型划分
从算法所得的类型角度划分,可将数据挖掘算法划分为直接型数据挖掘算法和间接性数据挖掘算法。
1、直接性数据挖掘
是一种“黑匣子”式的数据分析方式,其核心任务是根据已有数据,建立分类模型,并通过模型实现对新数据对象的分类等。因此,这种分析算法重点关注的是模型的分类预测精度。
2、间接性数据挖掘
是一种“半透明”式的数据分析方式。其核心任务是根据已有数据,建立数据的描述模型,并通过描述模型展现数据的内在特征和规律,揭示数据中隐藏的规律和关系。与直接型数据挖掘相比,间接型数据挖掘算法中一般没有特定的分类预测目标变量。因此,它更关注对数据内在联系和结构的展现程度
四、从学习过程的类型划分
从学习过程的角度划分,可将数据挖掘算法划分为有指导的学习算法和唔知道的学习算法。
1、有指导的学习算法
通常应用在分类问题中,核心目标是实现对新数据的分类预测。而分类预测模型的建立一定是建立在对历史数据的学习基础上的,因此历史数据就是一位“老师”,它始终指导着模型的建立和评价。
2、无监督的学习算法
通常应用在数据内部关系和结构的剖析问题中。由于这些关系和结构是事先未知的,所以学习过程是无“老师”参与的。
让数据流动起来,开启业绩增长!
了解500+品牌零售商使用LinkFlow的场景用例