扫一扫
关注中图网
官方微博
本类五星书更多>
-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
C Primer Plus 第6版 中文版
-
>
深度学习
-
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码
大数据原理及实践 版权信息
- ISBN:9787564239091
- 条形码:9787564239091 ; 978-7-5642-3909-1
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
大数据原理及实践 内容简介
近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。人们把这种大规模数据称为“海量数据”。 本书针对社会需求,为信息管理与信息系统专业本科生提供大数据存储及处理方面的知识。通过系统的讲解大规模数据的存储及处理等基础知识,使学生了解分布式数据处理系统的基本思想、原理及架构;通过实际案例分析及实践,使学生掌握大数据存储及处理的技术方法,*终使学生具备参与大规模分布式数据处理系统的搭建、数据分析及处理以及数据可视化等方面的能力。 本书大致目录:**章,**章,Hadoop生态系统介绍;第二章,Hadoop基本原理及环境搭建;第三章,HDFS基本操作及MapReduce编程;第四章,数据仓库HIVE的基本原理及应用;第五章,SPARK基本原理及应用;第六章,综合案例。
大数据原理及实践 目录
目 录
第1章 Hadoop生态系统简介/001
1.1 大数据发展/001
1.2 Hadoop平台介绍/006
1.3 相关的公司/009
1.4 Hadoop生态系统/011
第2章 Hadoop核心组件及其基本原理/014
2.1 HDFS基本原理/014
2.2 MapReduce分布式计算框架/022
2.3 Yarn介绍/029
第3章 Hadoop环境搭建/033
3.1 Linux基础/033
3.2 Linux的文件系统结构/036
3.3 文件类型/038
3.4 Linux基本操作命令/039
3.5 Linux下常用的工具软件/047
3.6 Hadoop环境搭建/051
第4章 Hive基本原理及安装部署/063
4.1 Hive基本原理/063
4.2 Hive的数据存储/064
4.3 Hive的安装部署/066
第5章 Hive的基本操作/070
5.1 Hive的DDL(data define language)操作/070
5.2 Hive的DML(data managed language)操作/076
5.3 Hive shell 参数/093
第6章 Spark基础知识/095
6.1 Spark原理/095
6.2 Spark架构及生态/098
6.3 Spark运行流程及特点/100
6.4 Spark运行模式/108
第7章 Spark RDD编程/114
7.1 RDD设计与运行原理/114
7.2 RDD基本操作/122
7.3 Spark SQL简介/132
第8章 基于MLLIB机器学习/140
8.1 概述/140
8.2 Spark分类和预测/142
8.3 决策树算法/145
8.4 朴素贝叶斯算法/152
8.5 回归分析与预测技术/157
8.6 聚类分析/167
大数据原理及实践
8.7 k-means聚类算法简介/172
8.8 DBSCAN聚类算法简介/179
8.9 关联规则分析简介/185
8.10 Apriori算法和FP Tree算法简介/188
参考文献/200
第1章 Hadoop生态系统简介/001
1.1 大数据发展/001
1.2 Hadoop平台介绍/006
1.3 相关的公司/009
1.4 Hadoop生态系统/011
第2章 Hadoop核心组件及其基本原理/014
2.1 HDFS基本原理/014
2.2 MapReduce分布式计算框架/022
2.3 Yarn介绍/029
第3章 Hadoop环境搭建/033
3.1 Linux基础/033
3.2 Linux的文件系统结构/036
3.3 文件类型/038
3.4 Linux基本操作命令/039
3.5 Linux下常用的工具软件/047
3.6 Hadoop环境搭建/051
第4章 Hive基本原理及安装部署/063
4.1 Hive基本原理/063
4.2 Hive的数据存储/064
4.3 Hive的安装部署/066
第5章 Hive的基本操作/070
5.1 Hive的DDL(data define language)操作/070
5.2 Hive的DML(data managed language)操作/076
5.3 Hive shell 参数/093
第6章 Spark基础知识/095
6.1 Spark原理/095
6.2 Spark架构及生态/098
6.3 Spark运行流程及特点/100
6.4 Spark运行模式/108
第7章 Spark RDD编程/114
7.1 RDD设计与运行原理/114
7.2 RDD基本操作/122
7.3 Spark SQL简介/132
第8章 基于MLLIB机器学习/140
8.1 概述/140
8.2 Spark分类和预测/142
8.3 决策树算法/145
8.4 朴素贝叶斯算法/152
8.5 回归分析与预测技术/157
8.6 聚类分析/167
大数据原理及实践
8.7 k-means聚类算法简介/172
8.8 DBSCAN聚类算法简介/179
8.9 关联规则分析简介/185
8.10 Apriori算法和FP Tree算法简介/188
参考文献/200
展开全部
书友推荐
- >
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
¥24.0¥48.0 - >
诗经-先民的歌唱
诗经-先民的歌唱
¥15.1¥39.8 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥11.0¥23.0 - >
我从未如此眷恋人间
我从未如此眷恋人间
¥16.4¥49.8 - >
李白与唐代文化
李白与唐代文化
¥9.9¥29.8 - >
巴金-再思录
巴金-再思录
¥33.1¥46.0 - >
名家带你读鲁迅:故事新编
名家带你读鲁迅:故事新编
¥13.0¥26.0 - >
名家带你读鲁迅:朝花夕拾
名家带你读鲁迅:朝花夕拾
¥10.5¥21.0
本类畅销
-
python 程序设计实用教程
¥38.3¥54 -
2022图书×抽奖盲袋
¥9.9¥25 -
2023读书月阅读盲盒——天黑,闭眼,刀谁?
¥42.3¥158 -
2022读者节纪念徽章-三星会员专属
¥45¥45.6