什么是机器学习?看完就明白了( 三 )


比如我们有1000张照片,假设我们之前已经定义好猫、狗的照片,做了训练,如果从这1000张照片中区分出来猫、狗的照片,那么这就是分类;
假设我们没做过猫狗的照片,我们只是对1000张照片的数据做一个归类,看看那些照片相似度高,分类完成后,在通过相似度比较高的几类,我们再定义这些类别的是猫、狗或是其他图片什么的 。
2. 回归
回归在统计学角度,指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法 。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析 。
在大数据分析中,回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系 。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系 。
回归从数学角度来看是一种方程式,是一种解题方法,一种通过一些函数因子的关系的一种学习方法 。比如以下简单的一个函数:
回归从算法角度来说,它是对有监督的连续数据结果的预测,比如通过一个人过去年份工资收入相关的影响参数,建立回归模型,然后通过相关的参数的变更来预测他未来工资收入 。
当然通过建立回归模型,再结合数学上对方程式的解析,我们也可以倒退出来为了一个预定的结果我们需要对那些参数值做优化 。回归最终要的是得到相关的参数和参数的特征值,因此我们通常在做回归分析时通常会做目标参数相关性分析 。
只要我们有足够的数据,都可以做一些回归分析帮助我们做预测与决策 。比如我们上线了一些功能,可以通过点击率、打开率、分享情况等等跟产生的业务结果做回归分析,如果建立了函数关系,我们就可以预测一些结果,再比如我们通过历史上年龄、体重、血压指标、血脂指标、是否抽烟、是否喝酒等指标跟某种疾病做回归分析,可以预测某一名人员是否有此疾病的风险等 。
所以回归的主要目的在于对连续数据产生的规律之后对新数据可能产生某种结果的预测 。
3. 降维
降维就是去除冗余的特征,降低特征参数的维度降低,用更加少的维度来表示特征,比如图像识别中将一幅图像转换成高纬度的数据集合,因为高纬度数据处理复杂度很高,我们就需要进行降维处理,降低了计算机处理高维度的图像数据的复杂性,减少了冗余数据造成的识别误差,提高识别经度 。
我们从统计学角度在理解一下机器学习的这四大应用,如果我们有一批样本,希望能够预测是都属于某相关属性,如果样本值是离散的,我们就可以使用分类的方法,如果是连续的我们就可以使用回归的方法,如果我们这批样本没有对应的属性,而是想挖掘其中的相关性,那么就用聚类的方式 。
如果我们涉及到的参数很多,维度很多,我们就可以用降维的方法去寻找更精准的参数,不管是做分类、聚类还是回归,都能达到更精确的判断和预测 。
除此之外,语音识别、图像识别、文本识别、语义分析等都是通过机器学习基本方法的综合利用 。
4. 不同应用场景算法举例
下图中针对不同应用场景做的算法举例,大家感兴趣可自行了解各个算法的原理 。

什么是机器学习?看完就明白了

文章插图
5. 理解机器学习应用对产品经理的意义
理解机器学习应用对产品经理非常有意义:
一方面产品经理需要理解机器学习到底能解决什么问题,面对我们的业务需求,是否可以通过机器学习的方式去满足我们的需求;同时理解了机器学习的应用也就是理解AI为什么中台作用这么明显 。