4.23文创礼盒,买2个减5元 读书月福利
欢迎光临中图网 请 | 注册
> >>
大数据架构商业之路-从业务需求到技术方案

大数据架构商业之路-从业务需求到技术方案

作者:黄申
出版社:机械工业出版社出版时间:2016-05-01
开本: 16开 页数: 298
中 图 价:¥55.2(8.0折) 定价  ¥69.0 登录后可看到会员价
暂时缺货 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
本类五星书更多>

大数据架构商业之路-从业务需求到技术方案 版权信息

大数据架构商业之路-从业务需求到技术方案 本书特色

本书先介绍大数据商业架构需要的各种技术知识,然后通过介绍一个虚拟的互联网创业案例,逐步展开介绍各个阶段可能遇到的业务需求,以及相对应的技术方案,甚至是技术难度。为了达到深入浅出,通俗易懂的效果,实战章节一般是从业务需求的描述入手,然后进行需求分析,根据需求的特点,对备选技术方案进行科普、概述和探讨,*后是技术方案确定和结论。

大数据架构商业之路-从业务需求到技术方案 内容简介

本书先介绍大数据商业架构需要的各种技术知识,然后通过介绍一个虚拟的互联网创业案例,逐步展开介绍各个阶段可能遇到的业务需求,以及相对应的技术方案,甚至是技术难度。为了达到深入浅出,通俗易懂的效果,实战章节一般是从业务需求的描述入手,然后进行需求分析,根据需求的特点,对备选技术方案进行科普、概述和探讨,*后是技术方案确定和结论。

大数据架构商业之路-从业务需求到技术方案 目录

contents 目  录推荐序一推荐序二前  言第1章 抉择 1第2章 数据收集 42.1 互联网数据收集 42.1.1 网络爬虫 52.1.2 apache nutch简介 112.1.3 heritrix简介 142.2 内部数据收集 152.2.1 apache flume简介 172.2.2 facebook scribe和logstash 212.3 本章心得 212.4 参考资料 22第3章 数据存储 233.1 持久化存储 233.1.1 hadoop和hdfs 253.1.2 hbase简介 283.1.3 mongodb 353.2 非持久化存储 373.2.1 缓存和散列 373.2.2 memcached和berkeley db简介 413.2.3 redis简介 413.3 本章心得 443.4 参考资料 44第4章 数据处理 464.1 离线批量处理 464.1.1 hadoop的mapreduce 474.1.2 spark简介 524.1.3 hive简介 534.1.4 pig、impala和spark sql 564.2 提升及时性:消息机制 584.2.1 activemq简介 604.2.2 kafka简介 614.3 在线实时处理 634.3.1 storm简介 634.3.2 spark streaming简介 664.4 本章心得 664.5 参考资料 67第5章 信息检索 695.1 基本理念 705.2 相关性 705.2.1 布尔模型 705.2.2 基于排序的布尔模型 715.2.3 向量空间模型 745.2.4 语言模型 755.3 及时性 775.4 与数据库查询的对比 815.5 搜索引擎 825.5.1 web搜索中的链接分析 835.5.2 电子商务中的商品排序 865.5.3 多因素和基于学习的排序 885.5.4 系统框架 895.5.5 lucene简介 935.5.6 solr简介 985.5.7 elasticsearch简介 1045.6 推荐系统 1085.6.1 推荐的核心要素 1095.6.2 推荐系统的分类 1105.6.3 混合模型 1155.6.4 系统架构 1165.6.5 mahout 1165.7 在线广告 1195.7.1 在线广告的类型 1205.7.2 广告投放机制 1245.7.3 广告的拍卖机制 1255.7.4 广告系统架构 1265.8 本章心得 1275.9 参考资料 128第6章 数据挖掘 1306.1 基本理念 1316.2 数据的表示和预处理 1336.2.1 数据的表示 1336.2.2 数据的预处理 1356.3 机器学习算法 1366.3.1 监督学习—分类 1376.3.2 监督学习—回归 1526.3.3 非监督学习—聚类 1536.4 挖掘工具 1576.4.1 mahout简介 1576.4.2 r简介 1596.5 本章心得 1656.6 参考资料 165第7章 效能评估 1677.1 效果评估 1687.1.1 离线评估 1697.1.2 非离线的评估 1837.2 性能评估 1907.2.1 计算复杂度 1917.2.2 应用系统性能 1937.2.3 jmeter工具 1977.3 本章心得 2027.4 参考资料 202第8章 大数据技术全景 204第9章 商品太多啦!需要搜索引擎 2079.1 业务需求 2079.2 产品设计和技术选型 2089.3 实现方案 2119.3.1 数据定义和配置 2119.3.2 集群搭建 2139.3.3 dih配置 216第10章 能否更主动?还需要推荐引擎 22310.1 业务需求 22310.2 产品设计和技术选型 22510.3 实现方案 23010.3.1 基于内容特征的衡量 23010.3.2 基于行为特征的衡量 23310.3.3 提供在线服务 236第11章 这样做的效果如何 24111.1 业务需求 24111.2 产品设计和技术选型 24211.3 实现方案 24311.3.1 行为数据的定义和记录 24311.3.2 flume和hdfs的集成 24611.3.3 通过hive进行分析 25211.3.4 kafka和storm的集成 254第12章 这个搜索有点逊 25812.1 业务需求:还要搜得更多 25812.2 “还要搜得更多”:产品设计和技术选型 25912.3 “还要搜得更多”的方案实现 26112.3.1 hbase的部署 26112.3.2 hbase和solr的集成 26412.4 业务需求:还要搜得更准 26512.5 “还要搜得更准”:产品设计和技术选型 26612.5.1 提升搜索排序的相关性 26612.5.2 提升搜索排序的整体效果 26812.6 “还要搜得更准”的方案实现 27112.7 业务需求:还要更快 27312.8 还要“变”得更快:产品设计和技术选型 27412.9 还要“搜”得更快:产品设计和技术选型 27512.10 业务需求:给点提示吧 28012.11 给点提示吧:产品设计和技术选型 282第13章 支持更高效的运营 28713.1 业务需求:互联网时代的crm 28713.2 互联网时代的crm:产品设计和技术选型 28813.3 业务需求:抓住捣蛋鬼 29113.4 抓住捣蛋鬼:产品设计和技术选型 29213.4.1 识别分类错放 29213.4.2 识别seo作弊 29413.5 业务需求:销售之战 29513.6 销售之战:产品设计和技术选型 29613.6.1 设置合理的价格 29613.6.2 识别黄牛 298后记 299
展开全部

大数据架构商业之路-从业务需求到技术方案 作者简介

黄申,博士,毕业于上海交通大学计算机科学与工程专业,师从俞勇教授。微软学者,IBMExtremeBlue天才计划成员。长期专注于大数据相关的搜索、推荐、广告以及用户精准化领域。曾在微软亚洲研究院、eBay中国、沃尔玛1号店和大润发飞牛网担任要职,带队完成了若干公司级的战略项目。同时著有20多篇国际论文和10多项国际专利,兼任《计算机工程》期刊特邀审稿专家。因其对业界的卓越贡献,2015年获得美国政府颁发的“美国杰出人才”称号。

商品评论(0条)
暂无评论……
书友推荐
编辑推荐
返回顶部
中图网
在线客服