商务数据挖掘与套用案例分析

商务数据挖掘与套用案例分析出版信息商务数据挖掘与套用案例分析作 译 者:蒋盛益出版时间:2014-01千 字 数:499版 次:01-01页 数:312开 本:16(185*260)I S B N :9787121222115内容简介本书由认识篇、技术篇和案例篇三部分组成,以商业领域中的问题为背景,重点在于讲解数据挖掘技术的套用 。认识篇从整体上介绍了数据挖掘的各种技术和数据挖掘建模过程,可使读者了解数据挖掘技术在商业领域中的套用概貌;技术篇介绍了数据挖掘中的聚类分析、分类、回归、关联规则挖掘、离群点检测等方法;案例篇展示了数据挖掘在6个不同行业中的套用案例,期望通过案例的分析使读者能够理解如何套用数据挖掘技术解决商业领域中的问题 。图书目录上篇 认 识 篇第1章 绪论 11.1 引例 11.2 数据挖掘产生的背景及概念 31.2.1 数据挖掘产生的背景 31.2.2 数据挖掘概念 41.3 数据挖掘任务及过程 51.3.1 数据挖掘任务 51.3.2 数据挖掘过程 51.4 数据挖掘常用软体简介 61.5 数据挖掘在商业领域中的套用 71.5.1 市场行销 81.5.2 交叉销售与交叉行销 91.5.3 客户关係管理 101.5.4 个性化推荐与个性化服务 111.5.5 风险分析与控制 121.5.6 欺诈行为检测和异常模式的发现 131.5.7 供应链库存管理中的需求预测 141.5.8 人力资源管理 151.6 数据挖掘技术的前景 161.7 本章小结 17第2章 数据挖掘建模方法 192.1 概述 192.2 业务理解 222.3 数据理解 222.4 数据準备 232.5 建模 252.5.1 成功建立预测模型的注意要点 252.5.2 如何建立有效的预测模型 272.6 评估 292.7 部署 302.8 本章小结 30中篇 技 术 篇第3章 聚类分析 333.1 概述 333.2 相似性度量 343.2.1 数据及数据类型 343.2.2 属性之间的相似性度量 353.2.3 对象之间的相似性度量 373.3 k-means 算法及其改进 393.3.1 k-means 算法 393.3.2 k-means聚类算法的改进 413.4 一趟聚类算法 463.4.1 算法描述 463.4.2 聚类阈值的选择策略 473.5 层次聚类算法 483.5.1 概述 483.5.2 BIRCH算法 493.5.3 两步聚类算法 513.6 SOM算法 533.6.1 SOM算法中网路的拓扑结构 533.6.2 SOM算法的聚类原理 543.7 聚类算法评价 563.7.1 监督度量 563.7.2 非监督度量 573.8 综合例子 573.9 本章小结 59第4章 分类 624.1 概述 634.2 决策树分类方法 634.2.1 决策树的基本概念 634.2.2 决策树的构建 654.2.3 Hunt算法 694.2.4 C4.5分类算法 704.2.5 CART算法 724.2.6 C4.5 与CART算法的区别 794.2.7 决策树分类算法的优点 794.3 朴素贝叶斯分类方法 794.3.1 朴素贝叶斯算法的相关概念 794.3.2 零条件机率问题的处理 804.3.3 朴素贝叶斯算法的优缺点 814.4 最近邻KNN分类方法 824.4.1 最近邻分类的基本概念 834.4.2 KNN算法优缺点 834.4.3 KNN的扩展 834.5 集成分类器 844.5.1 集成分类器的过程描述 844.5.2 构建集成分类器的方法 854.5.3 集成分类器方法优缺点 854.6 分类方法评价 854.7 综合例子 874.8 本章小结 88第5章 关联规则分析 905.1 概述 905.2 关联规则分析基础 915.2.1 基本概念 915.2.2 基础分析方法 925.3 Apriori算法 945.3.1 Apriori性质 945.3.2 Apriori算法原理 945.3.3 Apriori算法演示示例 955.3.4 Apriori算法评价 965.4 CARMA算法 975.4.1 Phase I阶段 975.4.2 Phase II阶段 1005.5 产生关联规则 1015.5.1 一般关联规则的产生 1015.5.2 Apriori算法关联规则的产生 1015.5.3 规则的评估标準 1035.6 关联规则扩展 1045.6.1 多层次关联规则 1045.6.2 多维度关联规则 1055.6.3 定量关联规则 1055.6.4 基于约束的关联规则 1055.6.5 序列模式挖掘 1065.7 综合例子 1065.7.1 概述 106 5.7.2 案例分析流程 1075.8 本章小结 110第6章 离群点检测 1136.1 概述 1136.2 基于相对密度的离群点检测方法 1156.3 基于聚类的离群点检测方法 1196.3.1 基于对象的离群因子方法 1206.3.2 基于簇的离群因子检测方法 1226.3.3 基于聚类的动态数据离群点检测 1246.4 离群点检测方法的评估 1246.5 本章小结 125第7章 回归分析 1267.1 概述 1267.2 线性回归模型 1277.2.1 多元线性回归模型的表示 1277.2.2 多元线性回归模型的检验 1287.3 非线性回归 1307.4 逻辑回归 1347.4.1 二元Logistic回归模型 1347.4.2 Logistic回归模型的係数估计 1347.4.3 Logistic回归模型係数的解释 1357.4.4 显着性检验 1367.4.5 回归方程的拟合优度检验 1377.5 本章小结 141第8章 为挖掘準备数据 1448.1 数据统计特性 1458.1.1 频率和众数 1458.1.2 百分位数 1458.1.3 中心度量 1458.1.4 散布程度度量 1468.2 数据预处理 1468.2.1 数据清理 1478.2.2 数据集成 1508.2.3 数据变换 1508.2.4 数据归约 1548.3 本章小结 155下篇 案 例 篇第9章 Clementine使用简介 1579.1 Clementine概述 1579.2 Clementine数据流操作 1589.2.1 生成数据流的基本过程 1589.2.2 节点操作 1599.2.3 数据流的其他管理 1609.3 输入、输出节点介绍 1629.3.1 数据源节点 1629.3.2 类型节点 1669.3.3 表节点 1679.3.4 数据导出节点 1689.4 数据预处理节点介绍 1689.4.1 过滤节点 1699.4.2 选择节点 1699.4.3 抽样节点 1709.4.4 平衡节点 1709.4.5 排序节点 1719.4.6 分区节点 1719.4.7 导出节点 1729.4.8 分箱节点 1749.4.9 特徵选择节点 1769.4.10 数据审核节点 1779.4.11 直方图节点 1789.4.12 分布图节点 1789.4.13 Web节点 1799.5 聚类节点介绍 1809.5.1 K-Means节点 180 9.5.2 Kohonen节点 1829.5.3 TwoStep节点 1849.5.4 Anomaly节点 1849.6 分类节点介绍 1869.6.1 C5.0节点 1869.6.2 C&R Tree节点 1889.6.3 BayesNet节点 1909.6.4 二元分类器节点 1929.6.5 Ensemble节点 1949.6.6 分析节点 1959.6.7 评估节点 1969.7 关联分析节点介绍 2009.7.1 Apriori节点 2009.7.2 CARMA节点 2029.7.3 Sequence节点 2039.8 回归分析节点介绍 2059.8.1 线性回归节点 2059.8.2 逻辑回归节点 2069.9 RFM分析节点介绍 2079.9.1 RFM汇总节点 2079.9.2 RFM分析节点 2089.10 本章小结 210第10章 数据挖掘在电信业中的套用 21110.1 数据挖掘在电信业的套用概述 21110.1.1 客户细分 21210.1.2 客户流失预测分析 21210.1.3 客户社会关係挖掘 21310.1.4 业务交叉销售 21410.1.5 欺诈客户识别 21410.2 案例10-1:客户通话模式分析 21510.2.1 商业理解 21510.2.2 数据理解阶段 21510.2.3 数据準备阶段 21710.2.4 建模阶段 21810.3 案例10-2:客户细分与流失分析 22310.3.1 商业理解 22310.3.2 数据理解阶段 22410.3.3 数据準备阶段 22510.3.4 建模阶段 22610.3.5 评估阶段 23010.4 案例10-3:移动业务关联分析 23210.4.1 商业理解 23210.4.2 数据理解阶段 23210.4.3 数据準备阶段 23310.4.4 建模阶段 23510.4.5 模型评估 23810.4.6 部署阶段 23910.5 本章小结 240第11章 数据挖掘在银行业中的套用 24111.1 数据挖掘在银行业中的套用概述 24111.2 案例11-1:信用风险分析 24311.2.1 商业理解 24311.2.2 数据理解 24311.2.3 数据準备阶段 24511.2.4 数据建模 24611.2.5 模型评估 24711.2.6 模型部署 24811.3 本章小结 249第12章 数据挖掘在目录行销中的套用 25012.1 套用概述 25012.1.1 RFM分析的基本原理 251 12.1.2 RFM模型的套用场景 25412.2 案例12-1:Charles读书俱乐部目录销售 25412.2.1 商业理解 25512.2.2 数据理解阶段 25512.2.3 数据準备阶段 25612.2.4 建模阶段 25712.2.5 评估阶段 26012.2.6 部署阶段 26012.3 案例12-2:旅游公司的目录销售 26012.3.1 商业理解 26012.3.2 数据理解阶段 26112.3.3 数据準备阶段 26112.3.4 建模阶段 26112.3.5 部署阶段 26312.4 本章小结 264第13章 数据挖掘在零售业中的套用 26513.1 数据挖掘在零售业中的套用概述 26513.2 案例13-1:关联分析在超市购物篮分析中的套用 26713.2.1 商业理解 26713.2.2 数据理解 26713.2.3 数据準备 26813.2.4 建立模型 26813.2.5 模型评估和套用 27113.2.6 节假日和工作日的比较分析 27213.3 案例13-2:超市工作时间与人员配置分析 27213.3.1 商业理解 27213.3.2 数据理解与準备 27313.3.3 建立模型 27313.3.4 模型评估与部署 27313.3.5 不同时段的商品销售规律 27413.3.6 时段与商品的销售规律 27413.4 本章小结 275第14章 数据挖掘在上市公司财务风险预警分析中的套用 27614.1 数据挖掘在上市公司财务风险预警分析中的套用概述 27614.2 案例14-1:上市公司财务报表舞弊识别 27814.2.1 商业理解 27814.2.2 数据理解与数据準备 27814.2.3 模型建立与评估 27914.3 案例14-2:上市公司财务困境预警 27914.3.1 商业理解阶段 28014.3.2 数据理解阶段 28014.3.3 数据準备阶段 28114.3.4 建模阶段 28214.3.5 部署实施 28314.4 本章小结 283第15章 数据挖掘在电子商务中的套用 28415.1 数据挖掘在电子商务中的套用概述 28415.2 主要套用领域 28515.2.1 网路客户关係管理 28515.2.2 网站设计最佳化 28615.2.3 推荐系统 28715.3 案例15-1:基于关联分析的淘宝网推荐 28915.3.1 商业理解阶段 28915.3.2 数据理解阶段 28915.3.3 数据準备阶段 29015.3.4 数据建模 291 15.3.5 模型评估 29115.3.6 部署阶段 29215.4 案例15-2:协同过滤技术在电影推荐上的简单套用 29215.4.1 协同过滤推荐简述 29215.4.2 商业理解阶段 29315.4.3 数据的理解、收集及準备 29315.4.4 建模阶段 29415.4.5 模型评估和部署 29515.5 本章小结 295附录A 数据挖掘常用资源列表 296参考文献 298