今天进行SPSS+实现基于分类算法的理财产品顾客亏损及收益分析的第三部分,对bi关联数据进行数据分析,通过知识准备中的身高预测模型,我们可以了解数据挖掘的定义,和基础的分类算法原理 。
1.知识准备
数据挖掘就是将这种科学应用到生活中,也就是各种指数 。例如:裙边理论:女性的裙子长度可以反映经济的兴衰,裙子越短,经济发展情况越好,裙子越长,经济发展情况越艰险 。另外,还有德国啤酒指数:每当气温上升1度,啤酒销量就平均增加230万瓶,这就是“德国啤酒指数”;空调指数:在日本夏季,温度每上升1度,空调的销量就平均增加30万台 。
这些行业指数都是统计学在某一方面的应用 。当然,现在的统计学已经大大超出了行业指数研究的范畴 。例如IBM在医疗领域利用技术解决了包括糖尿病、白内障、肿瘤等难题 。但是,无论是在过去、现在还是未来,人们总是希望能够借助观察事物(获取数据),通过合适的手段(建立统计挖掘模型)来量化这些关系 。例如,借助一个人的身高来预测他的体重 。
身高预测模型
上图是一个统计挖掘模型的基本形式 。简单来说,统计挖掘模型是指利用一个或多个输入变量(一般也被称为自变量)通过拟合适当的关系式来预测目标变量(也被称为因变量)的方法 。其中,f(x)是我们探求的关系式,但是其一般是固定并且未知的 。尽管f(x)未知,但是我们的目标是利用一系列的统计/挖掘方法来尽可能求出接近f(x)的模型,这种模型可以是一个简单的线性回归模型y=ax+b,也可能是一个曲线模型y=a+bx2,当然也有可能是一个神经网络模型或者一个决策树模型 。
这些模型从预测任务的角度看,估计出f(x)的形式并不意味着任务结束,在实际的商业实践中,可以将数据挖掘任务简单分为预测任务与控制任务 。
【三.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析】
文章插图
(1)预测任务:我们关心的是目标变量Y的预测 。预测模型f(x)的形式有可能是一个黑箱模型(即对于模型本身,我们不能很好解释或者并不清楚其内部结构,而是更加关心模型的输入和输出),只要能够提高预测精度,我们就认为达到目的了 。一般,神经网络模型属于典型的黑箱模型 。例如: X实验室开发出具有自主学习能力的神经网络模型,它能够从1000万张图片中找出那些有小猫的照片,其中,这1000万张图片就是输入,对于这些图片的识别就是输出 。
(2)控制任务:在控制任务中,我们希望能够尽可能地描述清楚X与Y的关系 。例如在金融行业,要通过客户的个人信用信息来评价个人的信用风险,这就要求模型不但能够回答这个客户的信用风险是高还是低,还要能回答哪些因素直接影响客户的信用风险,每个因素的影响程度有多大 。
2.顾客购买理财产品目的及选择本行的原因
从上面两个散点图分别表示所有顾客及亏损的顾客购买理财产品目的与选择本行的关系 。从中可以看出数据分布特点为:绝大多数购买目的为“长期资产保值增值”和“合理安排资金、分担风险”的顾客及亏损顾客选择本行原因为“预期年化收益率高” 。两组数据存在比较明显差异,说明购买目的与选择本行原因对于亏损存在较大影响 。
3.各类理财产品购买情况
文章插图
从上面两个气泡图分别表示所有顾客及亏损的顾客购买各类理财产品的情况 。两图差异较小可以说明理财产品选择的种类对于亏损影响不大 。从中可以看出数据分布特点为:
- 使用Samba实现文件共享:Windows和Linux之间
- 宰相老公在外面包小三原配带丫环扛刀讨说法
- 阎王要你三更死谁敢留你到五更这句话有何解?
- 一、实现纯颜色作为背景的轮播图
- python全景图像拼接_python实现图像全景拼接
- 第三、BFMatcher与Flann特征点匹配方法效果对比
- 三星980和980pro差多少
- 简单的轮播图实现
- 演义趣闻:关羽庞德黄忠三人孰强孰弱?
- 三星先行者计划是什么意思