中图网

>

计算机理论

PYTHON分布式机器学习

作者：[美]冠华·王著姜大为译

出版社：清华大学出版社出版时间：2023-04-01

开本：其他页数： 215

本类榜单：计算机/网络销量榜

中图价:¥74.3(7.5折) 定价 ~~¥99.0~~ 登录后可看到会员价

加入购物车收藏

运费6元，满69元免运费

?快递不能达地区使用邮政小包，运费14元起

云南、广西、海南、新疆、青海、西藏六省，部分地区快递不可达

本类五星书更多>

>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

¥11.3¥45
>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥28.2¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥55.2¥69
>
第一行代码Android

第一行代码Android

¥76.2¥99
>
C Primer Plus 第6版中文版

C Primer Plus 第6版中文版

¥75.6¥108
>
深度学习

深度学习

¥82.3¥168
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

¥43.5¥79

商品详情
商品评论(0条)

中图价:¥74.3 加入购物车

版权信息
本书特色
内容简介
目录
作者简介

微信公众号

PYTHON分布式机器学习版权信息

ISBN：9787302633112
条形码：9787302633112 ; 978-7-302-63311-2
装帧：一般胶版纸
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
计算机理论

PYTHON分布式机器学习本书特色

降低机器学习的时间成本可以缩短模型训练的等待时间，加快模型更新周期。分布式机器学习使机器学习从业者能够将模型训练和推理时间缩短几个数量级。在本书的帮助下，你应该能够将你的Python开发知识用于启动和运行分布式机器学习的实现，包括多节点机器学习系统

PYTHON分布式机器学习内容简介

《Python分布式机器学习》本书详细阐述了与分布式机器学习相关的基本解决方案，主要包括拆分输入数据、参数服务器和All-Reduce、构建数据并行训练和服务管道、瓶颈和解决方案、拆分模型、管道输入和层拆分、实现模型并行训练和服务工作流程、实现更高的吞吐量和更低的延迟、数据并行和模型并行的混合、联合学习和边缘设备、弹性模型训练和服务、进一步加速的高级技术等内容。此外，本书还提供了相应的示例、代码，以帮助读者进一步理解相关方案的实现过程。本书适合作为高等院校计算机及相关专业的教材和教学参考书，也可作为相关开发人员的自学用书和参考手册。

PYTHON分布式机器学习目录

第1篇数据并行

第1章拆分输入数据 3

1.1 单节点训练太慢 3

1.1.1 数据加载带宽和模型训练带宽之间的不匹配 5

1.1.2 流行数据集的单节点训练时间 5

1.1.3 使用数据并行加速训练过程 7

1.2 数据并行 8

1.2.1 随机梯度下降 11

1.2.2 模型同步 12

1.3 超参数调优 14

1.3.1 全局批次大小 14

1.3.2 学习率调整 14

1.3.3 模型同步方案 15

1.4 小结 16

第2章参数服务器和All-Reduce 17

2.1 技术要求 18

2.2 参数服务器架构 18

2.2.1 参数服务器架构中的通信瓶颈 19

2.2.2 在参数服务器之间分片模型 21

2.3 实现参数服务器 23

2.3.1 定义模型层 23

2.3.2 定义参数服务器 24

2.3.3 定义工作节点 25

2.3.4 在参数服务器和工作节点之间传递数据 26

2.4 参数服务器的问题 27

2.4.1 情况1—更多参数服务器 28

2.4.2 情况2—更多工作节点 28

2.4.3 参数服务器架构为从业者带来了很高的编码复杂度 28

2.5 All-Reduce架构 29

2.5.1 Reduce 29

2.5.2 All-Reduce 30

2.5.3 Ring All-Reduce 31

2.6 集体通信 33

2.6.1 Broadcast 33

2.6.2 Gather 34

2.6.3 All-Gather 35

2.7 小结 36

第3章构建数据并行训练和服务管道 37

3.1 技术要求 37

3.2 数据并行训练管道概述 38

3.2.1 输入预处理 39

3.2.2 输入数据分区 40

3.2.3 数据加载 41

3.2.4 数据训练 41

3.2.5 模型同步 42

3.2.6 模型更新 42

3.3 单机多GPU和多机多GPU 42

3.3.1 单机多GPU 43

3.3.2 多机多GPU 46

3.4 检查点和容错 52

3.4.1 模型检查点 52

3.4.2 加载模型检查点 53

3.5 模型评估和超参数调优 55

3.6 数据并行中的模型服务 57

3.7 小结 59

第4章瓶颈和解决方案 61

4.1 数据并行训练中的通信瓶颈 62

4.1.1 通信工作负载分析 62

4.1.2 参数服务器架构 62

4.1.3 All-Reduce架构 65

4.1.4 *新通信方案的效率问题 68

4.2 利用空闲链路和主机资源 69

4.2.1 Tree All-Reduce 69

4.2.2 通过PCIe和NVLink进行混合数据传输 75

4.3 设备内存瓶颈 76

4.4 重新计算和量化 77

4.4.1 重新计算 77

4.4.2 量化 81

4.5 小结 82

第2篇模型并行

第5章拆分模型 85

5.1 技术要求 86

5.2 单节点训练错误—内存不足 86

5.2.1 在单个GPU上微调BERT 86

5.2.2 尝试将一个巨型模型打包到单个GPU中 88

5.3 ELMo、BERT和GPT 90

5.3.1 基本概念 91

5.3.2 循环神经网络 94

5.3.3 ELMo 97

5.3.4 BERT 99

5.3.5 GPT 101

5.4 预训练和微调 102

5.5 *先进的硬件 103

5.5.1 P100、V100和DGX-1 103

5.5.2 NVLink 104

5.5.3 A100和DGX-2 105

5.5.4 NVSwitch 105

5.6 小结 105

第6章管道输入和层拆分 107

6.1 普通模型并行的低效问题 108

6.1.1 前向传播 109

6.1.2 反向传播 110

6.1.3 前向传播和反向传播之间的GPU空闲时间 111

6.2 管道输入 114

6.3 管道并行的优缺点 118

6.3.1 管道并行的优势 118

6.3.2 管道并行的缺点 118

6.4 层拆分 119

6.5 关于层内模型并行的注意事项 121

6.6 小结 122

第7章实现模型并行训练和服务工作流程 123

7.1 技术要求 124

7.2 整个模型并行管道概述 124

7.2.1 模型并行训练概述 124

7.2.2 实现模型并行训练管道 125

7.2.3 指定GPU之间的通信协议 127

7.2.4 模型并行服务 131

7.3 微调Transformer 134

7.4 模型并行中的超参数调优 136

7.4.1 平衡GPU之间的工作负载 136

7.4.2 启用/禁用管道并行 136

7.5 NLP模型服务 137

7.6 小结 138

第8章实现更高的吞吐量和更低的延迟 139

8.1 技术要求 140

8.2 冻结层 140

8.2.1 在前向传播期间冻结层 141

8.2.2 在前向传播期间降低计算成本 144

8.2.3 在反向传播期间冻结层 145

8.3 探索内存和存储资源 147

8.4 了解模型分解和蒸馏 150

8.4.1 模型分解 151

8.4.2 模型蒸馏 153

8.5 减少硬件中的位数 153

8.6 小结 154

第3篇高级并行范式

第9章数据并行和模型并行的混合 157

9.1 技术要求 158

9.2 Megatron-LM用例研究 158

9.2.1 模型并行和层拆分 159

9.2.2 按行试错法 161

9.2.3 按列试错法 165

9.2.4 跨机数据并行 168

9.3 Megatron-LM的实现 169

9.4 Mesh-TensorFlow用例研究 171

9.5 Mesh-TensorFlow的实现 172

9.6 Megatron-LM和Mesh-TensorFlow的比较 172

9.7 小结 173

第10章联合学习和边缘设备 175

10.1 技术要求 176

10.2 共享知识而不共享数据 176

10.2.1 传统数据并行模型训练范式 176

10.2.2 工作节点之间没有输入共享 178

10.2.3 在工作节点之间通信以同步梯度 179

10.3 用例研究：TensorFlow Federated 183

10.4 使用TinyML运行边缘设备 185

10.5 用例研究：TensorFlow Lite 185

10.6 小结 186

展开全部

PYTHON分布式机器学习作者简介

冠华·王是加州大学伯克利分校 RISELab 的计算机科学博士（导师为Ion Stoica教授）。他的研究主要集中在机器学习系统领域，包括快速集体通信、高效并行模型训练和实时模型服务等。他的研究得到了学术界和工业界的广泛关注。他曾受邀在顶级大学（麻省理工学院、斯坦福大学、卡内基梅隆大学和普林斯顿大学）和大型科技公司（Facebook/Meta和微软）进行演讲。他在香港科技大学获得硕士学位，在中国东南大学获得学士学位。他在无线网络方面还有一些很好的研究。他喜欢踢足球，并且曾在加州湾区跑过多次半程马拉松。

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐

>
随园食单
随园食单
袁枚
¥26.9~~¥48.0~~
>
罗庸西南联大授课录
罗庸西南联大授课录
罗庸
¥13.8~~¥32.0~~
>
山海经
山海经
林非
¥20.4~~¥68.0~~
>
自卑与超越
自卑与超越
[奥]阿尔弗雷德·阿德勒著，韩阳译
¥17.1~~¥39.8~~
>
月亮与六便士
月亮与六便士
[英]毛姆著,胡曦译
¥13.4~~¥42.0~~
>
史学评论
史学评论
杨玉圣
¥17.2~~¥42.0~~
>
回忆爱玛侬
回忆爱玛侬
[日]梶尾真治著，王玮译
¥10.5~~¥32.8~~
>
诗经-先民的歌唱
诗经-先民的歌唱
裴溥言
¥15.9~~¥39.8~~

本类畅销

数学之美

吴军著

¥48.3~~¥69~~
浪潮之巅-下册-第二版

吴军

¥22.1~~¥45~~
挑战程序设计竞赛(第2版)

秋叶拓哉，岩田阳一，北川宜稔　编，巫泽俊，庄俊元，李津羽　译

¥55.3~~¥79~~
算法竞赛入门经典-(第2版)

刘汝佳

¥34.9~~¥49.8~~
2022图书×抽奖盲袋

¥9.9~~¥25~~
2023读书月阅读盲盒——天黑，闭眼，刀谁？

中图网

¥42.3~~¥158~~

PYTHON分布式机器学习

PYTHON分布式机器学习版权信息

PYTHON分布式机器学习本书特色

PYTHON分布式机器学习内容简介

PYTHON分布式机器学习目录

PYTHON分布式机器学习作者简介

随园食单

罗庸西南联大授课录

山海经

自卑与超越

月亮与六便士

史学评论

回忆爱玛侬

诗经-先民的歌唱

数学之美

浪潮之巅-下册-第二版

挑战程序设计竞赛(第2版)

算法竞赛入门经典-(第2版)

2022图书×抽奖盲袋

2023读书月阅读盲盒——天黑，闭眼，刀谁？

陶潜和樱子

百年梦忆－梁实秋人生自述

熊千佳昆虫记

女孩们

上海滩的贾斯汀·比伯

房思琪的初恋乐园

PYTHON分布式机器学习

PYTHON分布式机器学习 版权信息

PYTHON分布式机器学习 本书特色

PYTHON分布式机器学习 内容简介

PYTHON分布式机器学习 目录

PYTHON分布式机器学习 作者简介

PYTHON分布式机器学习版权信息

PYTHON分布式机器学习本书特色

PYTHON分布式机器学习内容简介

PYTHON分布式机器学习目录

PYTHON分布式机器学习作者简介