什么是数据挖掘?数据挖掘的一般过程是怎样的?( 二 )


6、页面排名算法

什么是数据挖掘?数据挖掘的一般过程是怎样的?

文章插图
页面排名根据其外部和内部链接的数量和质量衡量网站的价值 。
7、Ada Boost 迭代算法
Ada boost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后将这些弱分类器组合起来形成一个更强的最终分类器(强分类器) 。分类器) 。
8、kNN最近邻分类算法
K最近邻(k-, KNN)分类算法是一种理论上成熟的方法,也是最简单的机器学习算法之一 。该方法的思想是:如果特征空间中k个最相似的样本(即特征空间中最近邻)中的大部分都属于某个类别,那么该样本也属于该类别 。
9、朴素贝叶斯
朴素贝叶斯算法利用对象的先验概率,利用贝叶斯公式计算其后验概率,选择后验概率最大的类作为对象所属的类 。朴素贝叶斯模型需要估计的参数少,对缺失数据的敏感性较低,算法相对简单 。
10、CART:分类和回归树算法 。
分类回归树算法(CART, and Trees)是一种分类数据挖掘算法 。它有两个关键思想:第一个是递归划分自变量空间的思想;第二个想法是使用data 进行剪枝 。
什么是数据挖掘?数据挖掘的一般过程是怎样的?

文章插图
结论:
一进入数据挖掘,深如海,苦苦挣扎到天亮 。光是这十种算法,就够你咀嚼半天了……
但请不要惊慌,想想你可以用机器的力量和数学的力量来了解世界的规律,用研究的东西来预测或做一些有趣的事情,这也是一种难得的享受!
【什么是数据挖掘?数据挖掘的一般过程是怎样的?】郑重声明:本文版权归原作者所有,转载文章仅出于传播更多信息之目的 。如果作者信息标注有误,请尽快联系我们修改或删除,谢谢 。