-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
C Primer Plus 第6版 中文版
-
>
深度学习
-
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码
发现数据之美-数据分析原理与实践 版权信息
- ISBN:9787121235580
- 条形码:9787121235580 ; 978-7-121-23558-0
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>>
发现数据之美-数据分析原理与实践 本书特色
大数据时代已经来临,这将引起深刻的行业变革。但是,大数据的真意在于数据分析,即从繁多的数据中找出洞见,并将其应用于实际决策中,以产生更明智的决策。这是一个看起来简单、做起来较难的事情。 《发现数据之美:数据分析原理与实践》从一个自底向上的角度,全面地阐述了数据分析所涉及的知识和技术,对于经典算法和工具的介绍也不止于泛泛而谈,而是加入了作者的经验和理解。所谓自底向上的角度,即从数据分析实践开始时所需要的数据准备、数据探查、数据再处理等,到经典的统计分析和数据挖掘算法及应用,还讲述了模型的部署,优化技术的引入,*终到决策自动化。 《发现数据之美:数据分析原理与实践》对企业管理者、数据分析从业者及高校的学生都有参考意义。管理者能看到一个较全面的数据分析的阐述,明确自身的需求;从业者能看到经验的总结及经典工具的使用;高校学生能看到数据分析所涉及的知识,对数据分析有一个全面的认识。
发现数据之美-数据分析原理与实践 内容简介
空谈无益,实干兴邦!
只有从纷繁的数据中找到线索,发现价值,大数据才能真正为我所用,成为真正意义上的数据资产!
《发现数据之美》提供了全面的数据分析思路、方法和技巧,一步一步地教会您如何寻找数据、鉴别数据、分析数据,并从数据分析中看到未来,做出富于远见的决策与管理。
作者是资深数据分析师,在该领域有近十年的丰富实践,对数据分析及数据价值有着扎实、透彻的理解,认为只有做好*基本的数据分析,才能真正把数据变成资产,产生价值——这在“大数据神话”甚嚣尘上的今日,无疑是一剂清凉贴,让我们冷静下来,重新审视自己的基本功。
不必犹豫,无须等待,数据分析之旅,始于《发现数据之美》。
发现数据之美-数据分析原理与实践 目录
1.1 业务分析是什么 .............................................. 2
1.2 业务分析的应用现状 ..................................... 3
1.3 如何应用业务分析 .......................................... 5
1.4 大数据与业务分析 .................................. 8
1.5 我们还在等什么 .............................. 9
第2 章 开始我们的旅程——从数据谈起 .................................... 10
2.1 我们讨论的数据结构 ..................................... 11
2.1.1 行(row)是什么 .................................................................................................. 12
2.1.2 列(column)是什么 ............................................................................................. 13
2.1.3 多少行数据才合适 ................................................................................................. 15
2.1.4 我们需要什么样的列 ............................................................................................. 16
2.2 statistics 和modeler 的基本知识 ................................................ 18
2.3 数据导入(loading data) ....................................................... 24
2.4 数据探查(data exploring) ............................. 27
2.4.1 正态分布(normal distribution) ......................................................................... 28
2.4.2 数据探查的常见统计量 ......................................................................................... 30
2.4.3 数据可视化 ............................................................................................................. 35
2.5 本章小结 ............................................................... 47
第3 章 在分析之前,还需要数据预处理 ............................................ 48
3.1 数据的问题 ............................................. 49
3.2 数据校验 .......................................................... 50
3.2.1 验证规则 ................................................................................................................. 50
3.2.2 验证数据 ................................................................................................................. 53
3.2.3 数据审计(data audit) ........................................................................................ 57
3.2.4 识别异常数据 ......................................................................................................... 60
3.3 数据集成(data integration) ............................................ 65
3.3.1 在statistics 中进行数据集成 ................................................................................. 66
3.3.2 在modeler 中进行数据集成 .................................................................................. 68
3.4 数据转换(data transformation) ..................................................... 73
3.4.1 分箱(binning) ..................................................................................................... 73
3.4.2 数据调整(data rescale) .................................................................................... 78
3.4.3 数据重新编码(recode) ..................................................................................... 79
3.5 自动数据准备 ................................................................ 83
3.5.1 statistics 中的自动数据准备 .................................................................................. 83
3.5.2 modeler 中的自动数据准备 ................................................................................... 88
3.6 本章小结 ............................................... 89
第4 章 经典分析——统计学的魅力 .................................. 91
4.1 随机变量及分布 ..................................................... 92
4.2 数理统计导引 .............................................. 94
4.3 参数估计 ................................................ 96
4.3.1 点估计...................................................................................................................... 96
4.3.2 区间估计 ................................................................................................................. 97
4.4 假设检验 .............................................................. 98
4.4.1 正态分布检验和t 检验 ........................................................................................ 101
4.4.2 非参数检验 ........................................................................................................... 108
4.5 相关分析 ............................................................ 111
4.6 方差分析 ............................................................... 113
4.7 回归分析 ............................................. 114
4.7.1 线性回归分析 ....................................................................................................... 114
4.7.2 自动化线性回归分析 ........................................................................................... 120
4.7.3 广义线性模型 ....................................................................................................... 122
4.7.4 广义线性混合模型(generalized linear mixed mode,glmm) .................. 128
4.8 本章小结 ........................................................... 135
第5 章 我想预测未来 ................................................................ 136
5.1 数据挖掘的技术分类 ............................................................... 136
5.1.1 有监督的建模技术 ............................................................................................... 137
5.1.2 无监督的建模技术 ............................................................................................... 138
5.1.3 feature selection 对于分类的意义 ...................................................................... 139
5.1.4 查看建模的结果 ................................................................................................... 139
5.2 决策树 ................................................................................................ 140
5.2.1 c5.0 算法 ............................................................................................................... 141
5.2.2 分类和回归树 ....................................................................................................... 145
5.2.3 卡方自动交互检测法(chaid) ....................................................................... 147
5.2.4 快速、无偏、高效的统计树(quest) .......................................................... 148
5.2.5 交互式的决策树构建方式 ................................................................................... 149
5.3 决策表 .............................................................................................. 150
5.3.1 决策表算法的设置 ............................................................................................... 151
5.3.2 交互式决策表的生成方式 ................................................................................... 153
5.4 贝叶斯网络 ........................................................................ 154
5.4.1 一些基本概念 ....................................................................................................... 154
5.4.2 ibm spss 的做法 ................................................................................................. 156
5.5 神经网络(neural networks) ...................................................... 158
5.5.1 神经网络是什么 ................................................................................................... 158
5.5.2 spss 神经网络算法 .............................................................................................. 160
5.6 支持向量机(support vector machine) ................................... 162
5.6.1 什么是线性分类器 ............................................................................................... 162
5.6.2 modeler 中的支持向量机 ..................................................................................... 163
5.7 *近相邻(nearest neighbor) .................................... 165
5.8 我该选用哪种算法 ......................................................... 167
5.9 如何评价预测结果 .............................................. 170
5.9.1 基本指标 ............................................................................................................... 170
5.9.2 gains ...................................................................................................................... 171
5.9.3 lift .......................................................................................................................... 173
5.9.4 response ................................................................................................................ 175
5.9.5 profit ...................................................................................................................... 175
5.9.6 roi ......................................................................................................................... 177
5.10 本章小结 .............................................................. 177
第6 章 我想发现聚类(cluster) ............................................... 179
6.1 聚类技术 ......................................................................... 180
6.2 分层聚类 ......................................................................... 181
6.3 k-means ....................................................................................... 184
6.4 twostep ...................................................................... 188
6.4.1 预聚类.................................................................................................................... 189
6.4.2 离群值处理 ........................................................................................................... 189
6.4.3 聚类 ........................................................................................................................ 189
6.4.4 twostep 的使用 .................................................................................................... 190
6.5 kohonen network .................................................. 192
6.6 我怎么知道聚类结果是好的 ............................................................. 194
6.6.1 考察聚类的数量和每个聚类中的记录数 ........................................................... 194
6.6.2 考察聚类内的特征 ............................................................................................... 195
6.6.3 考察聚类间的特征 ............................................................................................... 195
6.6.4 一个综合的考察指标silhouette .......................................................................... 196
6.7 自动聚类 ......................................................... 197
6.8 理解聚类的结果 ........................................................................... 198
6.9 一个聚类分析应用的例子 ............................................. 201
6.10 本章小结 ............................................................... 202
第7 章 周而复始的规律——时间序列分析 .......................................... 203
7.1 时间序列 ................................................................................ 204
7.1.1 时间序列的类型 ................................................................................................... 204
7.1.2 时间序列的特征 ................................................................................................... 205
7.2 指数平滑模型 ............................................................................. 206
7.2.1 简单指数平滑法 ................................................................................................... 206
7.2.2 带有趋势调整的指数平滑法(霍尔特指数平滑法) ....................................... 208
7.2.3 带有阻尼趋势的指数平滑法 ............................................................................... 208
7.2.4 简单季节指数平滑法 ........................................................................................... 209
7.2.5 带有趋势和季节调整的指数平滑法(温特斯指数平滑法) ........................... 209
7.2.6 指数平滑法的初始化 ........................................................................................... 210
7.2.7 去除时间序列的趋势和季节性因素 ................................................................... 211
7.3 自回归模型 ................................................ 212
7.3.1 自回归模型 ........................................................................................................... 212
7.3.2 移动平均模型 ....................................................................................................... 213
7.3.3 自回归移动平均模型(arma) ....................................................................... 213
7.3.4 差分自回归移动平均模型 ................................................................................... 214
7.4 spss 产品中的时间序列模型 ............................................... 214
7.4.1 statistics 中的时间序列模型 ................................................................................ 214
7.4.2 modeler 中的时间序列模型 ................................................................................. 235
7.5 时间序列分析的评价 ...................................................... 238
7.6 本章小结 ......................................................... 239
第8 章 你的行为完全可能被猜中——关联规则分析 ................................. 240
8.1 基本概念 ............................................................. 241
8.2 apriori 算法 ....................................................................... 245
8.2.1 apriori 算法工作步骤 ........................................................................................... 245
8.2.2 apriori 算法的评估方法 ....................................................................................... 246
8.2.3 apriori 节点 ........................................................................................................... 247
8.3 carma 算法 ................................................................................ 249
8.3.1 carma 算法的工作步骤 .................................................................................... 249
8.3.2 carma 节点 ........................................................................................................ 251
8.4 序列算法 ................................................................... 252
8.5 关联规则的评价 .......................................................................... 255
8.6 典型应用案例 .................................................................. 256
第9 章 我们还需要优化技术的帮忙 ......................................... 257
9.1 什么是优化技术 ....................................................................... 258
9.2 优化问题的分类 ....................................................................... 259
9.2.1 线性规划 ............................................................................................................... 260
9.2.2 整数规划 ............................................................................................................... 261
9.2.3 多目标规划 ........................................................................................................... 262
9.2.4 动态规划 ............................................................................................................... 262
9.3 ibm ilog optimization 介绍 ................................................. 263
9.4 本章小结 ...................................................................... 265
第10 章 有关方法论的问题 ..................................... 266
10.1 为什么我们要讨论方法论 .................................................. 267
10.2 crisp-dm .............................................................................. 267
10.2.1 crisp-dm 方法学 .............................................................................................. 268
10.2.2 crisp-dm 参考模型.......................................................................................... 270
10.3 ibm spss cads ...................................................................... 273
10.3.1 repository ............................................................................................................ 273
10.3.2 job ........................................................................................................................ 274
10.3.3 model refresh and champion challenger .......................................................... 274
10.3.4 scoring ................................................................................................................. 274
10.4 模型的部署不是终点............................................................... 275
第11 章 一个时髦的领域——决策管理 .................................................. 276
11.1 决策管理系统 ..................................................................... 276
11.1.1 什么是决策 .......................................................................................................... 277
11.1.2 什么是决策管理系统 .......................................................................................... 279
11.1.3 决策支持与决策管理的比较.............................................................................. 281
11.2 构建决策管理系统 ......................................................................... 282
11.2.1 构建决策支持系统的原则 .................................................................................. 282
11.2.2 合适的决策 .......................................................................................................... 283
11.2.3 如何找到合适的决策 .......................................................................................... 285
11.2.4 怎样在决策管理系统中定义决策 ..................................................................... 287
11.2.5 决策管理系统中的优化技术.............................................................................. 292
11.2.6 决策影响的评估 .................................................................................................. 294
11.2.7 监控决策 .............................................................................................................. 297
11.2.8 决策的持续改进 .................................................................................................. 298
11.2.9 构建和部署决策服务 .......................................................................................... 299
11.2.10 实施决策管理的一些要求................................................................................ 300
11.3 ibm adm ....................................................................... 301
11.3.1 adm 是spss 数据分析能力的窗口 ................................................................ 301
11.3.2 adm 的着眼点是将数据分析结果转化为决策 ............................................... 302
11.3.3 adm 是一个可以配置的决策服务平台 ........................................................... 303
11.3.4 adm 的工作步骤 ............................................................................................... 306
11.4 本章小结 ................................................................................ 308
后记 为未来做好准备 ......................................................... 309
发现数据之美-数据分析原理与实践 作者简介
彭鸿涛,毕业于西安交通大学软件学院,自2008年加入IBM SPSS部门以来,一直担任SPSS Analytical Decision Management 架构师和技术主管。由于工作需要,对数理统计和数据挖掘有长期的使用和研究,对SPSS的产品及解决方案有深入理解,特别擅长于将具体的数据分析技术应用到实际的商业问题解决中。除此之外,对图像分析也有较深入的实践和应用。 目前,正致力于大数据的应用。聂磊,瑞典查尔姆斯理工大学应用信息技术和可靠计算机系统双硕士,PMP。2008 年加入IBM SPSS部门,现为IBM Analytical Decision Management团队主管及资深开发人员,从事数据挖掘和企业级业务分析与优化解决方案等产品的研发、部署实施和集成架构咨询工作,对数据挖掘和决策支持有深刻的认识和理解,对SPSS的产品及解决方案有深入的研究。目前专注于大数据和云计算等技术的研究。
- >
姑妈的宝刀
姑妈的宝刀
¥11.4¥30.0 - >
大红狗在马戏团-大红狗克里弗-助人
大红狗在马戏团-大红狗克里弗-助人
¥3.3¥10.0 - >
【精装绘本】画给孩子的中国神话
【精装绘本】画给孩子的中国神话
¥17.6¥55.0 - >
罗曼·罗兰读书随笔-精装
罗曼·罗兰读书随笔-精装
¥40.6¥58.0 - >
小考拉的故事-套装共3册
小考拉的故事-套装共3册
¥36.7¥68.0 - >
二体千字文
二体千字文
¥16.0¥40.0 - >
经典常谈
经典常谈
¥17.1¥39.8 - >
我与地坛
我与地坛
¥16.8¥28.0
-
算法与数据结构:C语言版
¥22.3¥29 -
2022图书×抽奖盲袋
¥9.9¥25 -
2023读书月阅读盲盒——天黑,闭眼,刀谁?
¥42.3¥158 -
2022读者节纪念徽章-三星会员专属
¥45¥45.6 -
2023读书月阅读盲盒——我什么场面没见过?
¥42.3¥158