中图网

>

人工智能

深度实践Spark机器学习

作者：吴茂贵

出版社：机械工业出版社出版时间：2018-02-01

开本： 16开 页数： 234页

本类榜单：计算机/网络销量榜

中图价:¥33.8(4.9折) 定价 ~~¥69.0~~ 登录后可看到会员价

暂时缺货收藏

运费6元，满69元免运费

?快递不能达地区使用邮政小包，运费14元起

云南、广西、海南、新疆、青海、西藏六省，部分地区快递不可达

温馨提示：5折以下图书主要为出版社尾货，大部分为全新（有塑封/无塑封），个别图书品相8-9成新、切口
有划线标记、光盘等附件不全详细品相说明>>

本类五星书更多>

>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

¥11.3¥45
>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥28.2¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥55.2¥69
>
第一行代码Android

第一行代码Android

¥76.2¥99
>
C Primer Plus 第6版中文版

C Primer Plus 第6版中文版

¥75.6¥108
>
深度学习

深度学习

¥82.3¥168
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

¥43.5¥79

商品详情
商品评论(0条)

中图价:¥33.8 暂时缺货

版权信息
本书特色
内容简介
目录

微信公众号

深度实践Spark机器学习版权信息

ISBN：9787111589952
条形码：9787111589952 ; 978-7-111-58995-2
装帧：一般胶版纸
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
人工智能

深度实践Spark机器学习本书特色

本书以新的Spark2.0为技术基础，重点讲解了如何构建机器学习系统以及如何实现机器学习流程的标准化，这两点都是目前同类书中没有的。第1～7章从概念、架构、算法等角度介绍了机器学习的基本概念；第8～12章以实例为主，详细讲解了机器学习流程标准化涉及的关键技术；第13章主要以在线数据或流式数据为主介绍了流式计算框架SparkStreaming；第14章重点讲解了深度学习的框架TensorFlowOnSprak。此外，附录部分提供了线性代数、概率统计及Scala的基础知识，帮助读者更好地学习和掌握机器学习的相关内容。

深度实践Spark机器学习内容简介

本书以新的Spark2.0为技术基础，重点讲解了如何构建机器学习系统以及如何实现机器学习流程的标准化，这两点都是目前同类书中没有的。第1～7章从概念、架构、算法等角度介绍了机器学习的基本概念；第8～12章以实例为主，详细讲解了机器学习流程标准化涉及的关键技术；第13章主要以在线数据或流式数据为主介绍了流式计算框架SparkStreaming；第14章重点讲解了深度学习的框架TensorFlowOnSprak。此外，附录部分提供了线性代数、概率统计及Scala的基础知识，帮助读者更好地学习和掌握机器学习的相关内容。

深度实践Spark机器学习目录

目　　录?Contents
前言
第1章　了解机器学习 1
1.1　机器学习的定义 1
1.2　大数据与机器学习 2
1.3　机器学习、人工智能及深度学习 2
1.4　机器学习的基本任务 3
1.5　如何选择合适算法 4
1.6　Spark在机器学习方面的优势 5
1.7　小结 5
第2章　构建Spark机器学习系统 6
2.1　机器学习系统架构 6
2.2　启动集群 7
2.3　加载数据 9
2.4　探索数据 10
2.4.1　数据统计信息 10
2.4.2　数据质量分析 11
2.4.3　数据特征分析 12
2.4.4　数据的可视化 17
2.5　数据预处理 19
2.5.1　数据清理 20
2.5.2　数据变换 21
2.5.3　数据集成 22
2.5.4　数据归约 23
2.6　构建模型 25
2.7　模型评估 26
2.8　组装 30
2.9　模型选择或调优 30
2.9.1　交叉验证 31
2.9.2　训练–验证切分 32
2.10　保存模型 32
2.11　小结 33
第3章　ML Pipeline原理与实战 34
3.1　Pipeline简介 34
3.2　DataFrame 35
3.3　Pipeline组件 36
3.4　Pipeline原理 37
3.5　Pipeline实例 38
3.5.1　使用Estimator、Transformer和Param的实例 38
3.5.2　ML使用Pipeline的实例 40
3.6　小结 41
第4章　特征提取、转换和选择 42
4.1　特征提取 42
4.1.1　词频—逆向文件
频率（TF-IDF） 42
4.1.2　Word2Vec 43
4.1.3　计数向量器 44
4.2　特征转换 45
4.2.1　分词器 45
4.2.2　移除停用词 46
4.2.3　n-gram 47
4.2.4　二值化 48
4.2.5　主成分分析 48
4.2.6　多项式展开 50
4.2.7　离散余弦变换 50
4.2.8　字符串—索引变换 51
4.2.9　索引—字符串变换 53
4.2.10　独热编码 54
4.2.11　向量—索引变换 57
4.2.12　交互式 58
4.2.13　正则化 59
4.2.14　规范化 60
4.2.15　*大值—*小值缩放 60
4.2.16　*大值—绝对值缩放 61
4.2.17　离散化重组 62
4.2.18　元素乘积 63
4.2.19　SQL转换器 64
4.2.20　向量汇编 65
4.2.21　分位数离散化 66
4.3　特征选择 67
4.3.1　向量机 67
4.3.2　R公式 69
4.3.3　卡方特征选择 70
4.4　小结 71
第5章　模型选择和优化 72
5.1　模型选择 72
5.2　交叉验证 73
5.3　训练验证拆分法 75
5.4　自定义模型选择 76
5.5　小结 78
第6章　Spark MLlib基础 79
6.1　Spark MLlib简介 80
6.2　Spark MLlib架构 81
6.3　数据类型 82
6.4　基础统计 84
6.4.1　摘要统计 84
6.4.2　相关性 84
6.4.3　假设检验 85
6.4.4　随机数据生成 85
6.5　RDD、Dataframe和Dataset 86
6.5.1　RDD 86
6.5.2　DatasetDataFrame 87
6.5.3　相互转换 88
6.6　小结 89
第7章　构建Spark ML推荐模型 90
7.1　推荐模型简介 91
7.2　数据加载 92
7.3　数据探索 94
7.4　训练模型 94
7.5　组装 95
7.6　评估模型 96
7.7　模型优化 96
7.8　小结 98
第8章　构建Spark ML分类模型 99
8.1　分类模型简介 99
8.1.1　线性模型 100
8.1.2　决策树模型 101
8.1.3　朴素贝叶斯模型 102
8.2　数据加载 102
8.3　数据探索 103
8.4　数据预处理 104
8.5　组装 109
8.6　模型优化 110
8.7　小结 113
第9章　构建Spark ML回归模型 114
9.1　回归模型简介 115
9.2　数据加载 115
9.3　探索特征分布 117
9.4　数据预处理 120
9.4.1　特征选择 121
9.4.2　特征转换 121
9.5　组装 122
9.6　模型优化 124
9.7　小结 126
第10章　构建Spark ML聚类模型 127
10.1　K-means模型简介 128
10.2　数据加载 129
10.3　探索特征的相关性 129
10.4　数据预处理 131
10.5　组装 132
10.6　模型优化 134
10.7　小结 136
第11章　PySpark 决策树模型 137
11.1　PySpark 简介 138
11.2　决策树简介 139
11.3　数据加载 140
11.3.1　原数据集初探 140
11.3.2　PySpark的启动 142
11.3.3　基本函数 142
11.4　数据探索 143
11.5　数据预处理 143
11.6　创建决策树模型 145
11.7　训练模型进行预测 146
11.8　模型优化 149
11.8.1　特征值的优化 149
11.8.2　交叉验证和网格参数 152
11.9　脚本方式运行 154
11.9.1　在脚本中添加配置信息 154
11.9.2　运行脚本程序 154
11.10　小结 154
第12章　SparkR朴素贝叶斯模型 155
12.1　SparkR简介 156
12.2　获取数据 157
12.2.1　SparkDataFrame数据结构
说明 157
12.2.2　创建SparkDataFrame 157
12.2.3　SparkDataFrame的常用操作 160
12.3　朴素贝叶斯分类器 162
12.3.1　数据探查 162
12.3.2　对原始数据集进行转换 163
12.3.3　查看不同船舱的生还率差异 163
12.3.4　转换成SparkDataFrame格式的数据 165
12.3.5　模型概要 165
12.3.6　预测 165
12.3.7　评估模型 166
12.4　小结 167
第13章　使用Spark Streaming构建在线学习模型 168
13.1　Spark Streaming简介 168
13.1.1　Spark Streaming常用术语 169
13.1.2　Spark Streaming处理流程 169
13.2　Dstream操作

展开全部

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐

>
苦雨斋序跋文-周作人自编集
苦雨斋序跋文-周作人自编集
周作人著，止庵校订
¥6.9~~¥16.0~~
>
我从未如此眷恋人间
我从未如此眷恋人间
史铁生/汪曾祺
¥16.4~~¥49.8~~
>
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
[苏]阿尔谢尼耶夫著，刘宇译
¥24.0~~¥48.0~~
>
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
易竹贤
¥11.0~~¥23.0~~
>
唐代进士录
唐代进士录
陶易
¥19.1~~¥39.8~~
>
名家带你读鲁迅:朝花夕拾
名家带你读鲁迅:朝花夕拾
鲁迅著，陈漱渝主编
¥10.5~~¥21.0~~
>
推拿
推拿
毕飞宇
¥12.2~~¥32.0~~
>
上帝之肋:男人的真实旅程
上帝之肋:男人的真实旅程
[美] 罗伯特·布莱著，田国力/卢文戈译
¥19.3~~¥35.0~~

本类畅销

深度学习自然语言处理实战

张楠[等]编著

¥25.8~~¥59.9~~
过程控制

李文涛

¥11.9~~¥35~~
2022图书×抽奖盲袋

¥9.9~~¥25~~
2023读书月阅读盲盒——天黑，闭眼，刀谁？

中图网

¥42.3~~¥158~~
2023读书月阅读盲盒——十万个为什么里面为什么没有我想问的为什么？

中图网

¥88~~¥260~~
2022读者节纪念徽章-三星会员专属

中图网

¥45~~¥45.6~~

深度实践Spark机器学习

深度实践Spark机器学习版权信息

深度实践Spark机器学习本书特色

深度实践Spark机器学习内容简介

深度实践Spark机器学习目录

苦雨斋序跋文-周作人自编集

我从未如此眷恋人间

中国人在乌苏里边疆区:历史与人类学概述

新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)

唐代进士录

名家带你读鲁迅:朝花夕拾

推拿

上帝之肋:男人的真实旅程

深度学习自然语言处理实战

过程控制

2022图书×抽奖盲袋

2023读书月阅读盲盒——天黑，闭眼，刀谁？

2023读书月阅读盲盒——十万个为什么里面为什么没有我想问的为什么？

2022读者节纪念徽章-三星会员专属

百年梦忆－梁实秋人生自述

熊千佳昆虫记

人间草木

女孩们

时间停止的那一天

上海滩的贾斯汀·比伯

深度实践Spark机器学习

深度实践Spark机器学习 版权信息

深度实践Spark机器学习 本书特色

深度实践Spark机器学习 内容简介

深度实践Spark机器学习 目录

深度实践Spark机器学习版权信息

深度实践Spark机器学习本书特色

深度实践Spark机器学习内容简介

深度实践Spark机器学习目录