大数据、数据挖掘与智慧运营【大数据、数据挖掘与智慧运营】《大数据、数据挖掘与智慧运营》是2017年清华大学出版社出版的图书 , 图书作者是梁栋 张兆静 彭木根 。
基本介绍书名:大数据、数据挖掘与智慧运营
作者:梁栋 张兆静 彭木根
ISBN:9787302483373
定价:99元
出版时间:2017.11.01
印次:1-1
印刷日期:2017.10.20
内容简介本书系统地介绍了大数据挖掘的基本概念、经典挖掘算法、挖掘工具和企业智慧运营套用案例 。全书分为9章 , 内容包括:大数据挖掘与智慧运营的概念 , 数据预处理 , 数据挖掘中的四种主流算法:聚类分析、分类分析、回归分析、关联分析 , 增强型数据挖掘算法 , 数据挖掘在运营商智慧运营中的套用案例 , 未来大数据挖掘的发展趋势等 。全书以运用大数据挖掘方法提升企业运营业绩与效率为主线 , 从运营商实际工作中选取了大量运营和销售案例 , 详细讲述了数据採集、挖掘建模、模型落地与精準行销的全部过程 。书中大部分案例的代码、软体操作流程和微课视频可以通过扫描本书封底的二维码下载 。本书主要面向运营商及其他高科技企业员工、高等院校相关专业本科生和研究生 , 以及其他对数据挖掘与精準行销感兴趣的读者 。目录结构第1章 大数据、数据挖掘与智慧运营综述 11.1 数据挖掘的发展史 21.1.1 数据挖掘的定义与起源 21.1.2 数据挖掘的早期发展 31.1.3 数据挖掘的算法前传 41.1.4 数据挖掘的第一个里程碑 81.1.5 最近十年的发展与套用 111.2 数据挖掘的主要流程与金字塔模型 131.2.1 数据挖掘的任务 141.2.2 数据挖掘的基本步骤 161.2.3 数据挖掘的架构——云计算 171.2.4 “金字塔”模型 201.3 数据挖掘对智慧运营的意义 221.3.1 “网际网路+”时代的来临及其对运营商的冲击和挑战 221.3.2 大数据时代的来临及其对运营商的挑战和机遇 241.3.3 电信运营商运营发展面临的主要瓶颈 261.3.4 电信运营商发展的“三条曲线” 271.3.5 智慧运营与大数据变现 291.3.6 数据挖掘对于提升智慧运营效率的意义 301.4 大数据时代已经来临 311.4.1 大数据的定义 311.4.2 大数据的“4V”特徵321.4.3 结构化数据与非结构化数据331.5 非结构化数据挖掘的研究进展 341.5.1 文本挖掘341.5.2 模式识别361.5.3 语音识别401.5.4 视频识别441.5.5 其他非结构化数据挖掘481.6 数据挖掘与机器学习、深度学习、人工智慧及云计算 501.6.1 机器学习511.6.2 深度学习531.6.3 人工智慧551.6.4 云计算561.7 现有数据挖掘的主要分析软体与系统 611.7.1 Hadoop611.7.2 Storm 631.7.3 Spark 651.7.4 SPASS(SPSS) 661.7.5 SAS 68参考文献 70第2章数据统计与数据预处理732.1 数据属性类型 742.1.1 数据属性定义742.1.2 离散属性742.1.3 连续属性752.2 数据的统计特性 772.2.1 中心趋势度量772.2.2 数据散布度量782.2.3 数据相关性822.3 数据预处理 872.3.1 数据预处理概述873.6 基于格线的聚类:CLIQUE 1403.6.1 基于格线的聚类算法概述1403.6.2 CLIQUE算法的基本原理1413.6.3 CLIQUE算法的优势与劣势142参考文献 143第4章分类分析 1454.1 分类分析概述 1464.2 分类分析的评估 1484.3 决策树分析 1524.3.1 决策树算法的基本原理1524.3.2 CHAID决策树1604.3.3 ID3决策树 1674.3.4 C4.5决策树1714.3.5 CART 决策树1754.3.6 决策树中的剪枝问题1794.3.7 决策树在SPSS中的套用1804.4 最近邻分析(KNN) 1854.4.1 KNN算法的基本原理1854.4.2 KNN算法流程1864.4.3 KNN算法的若干问题1874.4.4 KNN分类器的特徵1884.4.5 KNN算法在SPSS中的套用 1884.5 贝叶斯分析 1914.5.1 贝叶斯定理1914.5.2 朴素贝叶斯分类1924.5.3 贝叶斯网路1954.6 神经网路 1994.6.1 感知器2004.6.2 多重人工神经网路2014.6.3 人工神经网路的特点2034.7 支持向量机 204第6章关联分析 2456.1 关联分析概述 2466.2 关联分析的评估指标 2476.2.1 支持度2476.2.2 置信度2486.2.3 算法複杂度2486.3 Apriori 算法 2496.3.1 频繁项集的定义与产生2496.3.2 先验原理2516.3.3 基于支持度的计数与剪枝2526.3.4 候选项集生成2536.3.5 基于置信度的剪枝2596.3.6 Apriori算法规则生成 2596.4 FP-tree 算法 2616.4.1 频繁模式树2616.4.2 FP-tree算法频繁项集的产生2636.4.3 FP-tree算法规则生成2636.4.4 算法性能对比与评估2646.5 SPSS Modeler 关联分析实例 265参考文献 269第7章增强型数据挖掘算法 271 7.1 增强型数据挖掘算法概述 2727.1.1 组合方法的优势2727.1.2 构建组合分类器的方法2727.2 随机森林 2737.2.1 随机森林的原理2737.2.2 随机森林的优缺点2767.2.3 随机森林的泛化误差2767.2.4 输入特徵的选择方法2777.3 Bagging 算法 2778.4.4 多元线性回归建模3508.4.5 制定层次化、个性化精準行销方案3518.4.6 落地效果评估与模型调优3528.5 客户保有 3538.5.1 总结客户流失的历史规律3548.5.2 细分潜在流失客户群体3578.5.3 客户保有效益建模与最优决策3598.5.4 落地效果评估3618.6 投诉预警 3638.6.1 客户投诉现象分析3638.6.2 挖掘潜在客户群体3668.6.3 制定个性化关怀方案3688.7 网路质量栅格化呈现 3688.7.1 栅格化呈现的基本原理3698.7.2 覆盖栅格化3708.7.3 基于流量聚簇的网路最佳化策略3728.8 无线室内定位 3768.8.1 传统室内定位方法3768.8.2 基于Wi-Fi 信号的指纹定位算法 3788.8.3 基于数据挖掘算法的改进定位方法379参考文献 383第9章面向未来大数据的数据挖掘与机器学习发展趋势 3859.1 大数据时代数据挖掘与机器学习面临的新挑战 3869.2 IEEE ICDM 会议数据挖掘与机器学习的最新研究进展 3959.3 “计算机奥运会”——Sort Benchmark 400参考文献 402