-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
C Primer Plus 第6版 中文版
-
>
深度学习
-
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码
Spark高级数据分析 版权信息
- ISBN:9787115404749
- 条形码:9787115404749 ; 978-7-115-40474-9
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>>
Spark高级数据分析 本书特色
本书是使用spark进行大规模数据分析的实战宝典,由大数据公司cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了spark,然后介绍了用spark和scala进行数据处理的基础知识,接着讨论了如何将spark用于机器学习,同时介绍了常见应用中几个常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询wikipedia或分析基因数据。
Spark高级数据分析 内容简介
这是一本实用手册,四位作者均是cloudera公司的数据科学家,他们联袂展示了利用spark进行大规模数据分析的若干模式,而且每个模式都自成一体。他们将spark、统计学方法和真实数据集结合起来,通过实例向读者讲述了怎样解决分析型问题。 本书首先介绍了spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金融领域的若干模式。如果你对机器学习和统计学有基本的了解,并且会用java、python或scala编程,这些模式将有助于你开发自己的数据应用。 本书介绍了以下模式: 音乐推荐和audioscrobbler数据集 用决策树算法预测森林植被 基于k均值聚类进行网络流量的异常检测 基于潜在语义分析技术分析维基百科 用graphx分析伴生网络 对纽约出租车轨迹进行空间和时间数据分析 通过蒙特卡罗模拟来评估金融风险 基因数据分析和bdg项目 用pyspark和thunder分析神经图像数据
Spark高级数据分析 目录
Spark高级数据分析 相关资料
“四位作者研习spark已久,他们在本书中跟读者分享了关于spark的大量精彩内容,而且本书的案例部分同样出众!对于这本书,我钟爱的是它强调案例,且这些案例都源于现实数据和实际应用……认真研读此书,你应该可以吸收这些案例中的思想,并直接将其运用在自己的项目中!” ——matei zaharia,databricks公司cto兼apache spark项目副总裁
Spark高级数据分析 作者简介
Sandy Ryza是Cloudera公司数据科学家,Apache Spark项目的活跃代码贡献者。领导了Cloudera公司的Spark开发工作。他还是Hadoop项目管理委员会委员。 Uri Laserson是Cloudera公司数据科学家,专注于Hadoop生态系统中的Python部分。 Sean Owen是Cloudera公司EMEA地区的数据科学总监,也是Apache Spark项目的代码提交者。他创立了基于Spark、Spark Streaming和Kafka的Hadoop实时大规模学习项目Oryx(之前称为Myrrix)。 Josh Wills是Cloudera公司的高级数据科学总监,Apache Crunch项目的发起者和副总裁。
-
算法与数据结构:C语言版
¥22.3¥29 -
2022图书×抽奖盲袋
¥9.9¥25 -
2023读书月阅读盲盒——天黑,闭眼,刀谁?
¥42.3¥158 -
2022读者节纪念徽章-三星会员专属
¥45¥45.6 -
2023读书月阅读盲盒——我什么场面没见过?
¥42.3¥158