欢迎光临中图网 请 | 注册
> >>
Anaconda数据科学实战

Anaconda数据科学实战

出版社:人民邮电出版社出版时间:2020-05-01
开本: 24cm 页数: 284页
中 图 价:¥57.7(7.3折) 定价  ¥79.0 登录后可看到会员价
暂时缺货 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
本类五星书更多>

Anaconda数据科学实战 版权信息

  • ISBN:9787115534507
  • 条形码:9787115534507 ; 978-7-115-53450-7
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>>

Anaconda数据科学实战 本书特色

Anaconda是一个强大的开源数据科学平台,它将很多好的工具整合在一起,极大地简化了使用者的工作流程,并能够帮助使用者解决一系列数据科学难题。 《Anaconda数据科学实战》旨在通过一系列示例,引导读者在编码和图表中了解Anaconda的强大之处。本书包括12章,结合R、Python、Octave和Julia等4种编程语言,从平台的安装和配置开始,循序渐进地引导读者掌握数据集的获取、数据可视化、统计建模、管理包、Anaconda的优化、无监督学习、监督学习、数据预测分析、云、分布式计算等内容。 本书示例丰富,讲解细致,作者不仅在金融领域有着深厚的积累,还有着丰富的教学经验。对于那些有兴趣了解金融领域数据科学的读者,以及普通的数据分析师或数据科学从业者,本书都是一个不错的选择。在阅读本书之前,我们希望读者具备R或Python的基本编程知识,以及线性代数相关的基本知识。

Anaconda数据科学实战 内容简介

本书讲解的是如何使用该工具在真实的环境中执行数据科学任务。本书涵盖了Anaconda的基础知识 (下载、安装、配置) , 使用Conda进行包管理的方法, 以及使用各种包进行数据分析的知识 (数据整理、归类、建模、可视化等) 。

Anaconda数据科学实战 目录

第 1章 Anaconda生态系统 1

1.1 简介 1

1.1.1 通过Anaconda使用

Jupyter的理由 2

1.1.2 在无须预装的情况下

使用Jupyter 2

1.2 Miniconda 5

1.3 Anaconda云 5

1.4 查找帮助 6

1.5 总结 8

1.6 问题回顾及练习 9

第 2章 Anaconda安装 11

2.1 安装Anaconda 11

2.2 测试Python 13

2.3 使用IPython 14

2.4 通过Jupyter使用Python 16

2.5 Spyder简介 17

2.6 通过Conda安装R 19

2.7 安装Julia并链接到Jupyter 20

2.8 安装Octave并链接到Jupyter 21

2.9 查找帮助 23

2.10 总结 25

2.11 问题回顾及练习 25

第3章 数据基础 27

3.1 数据源 28

3.2 UCI机器学习 28

3.3 Python包pandas简介 31

3.4 输入数据的几种方式 32

3.4.1 使用R输入数据 33

3.4.2 使用Python输入数据 34

3.5 Quandl数据分发平台简介 36

3.6 处理缺失数据 39

3.7 数据排序 42

3.7.1 切割数据集 45

3.7.2 合并不同数据集 45

3.7.3 数据输出 48

3.8 Python包cbsodata简介 49

3.9 Python包datadotworld简介 50

3.10 R包haven和foreign简介 51

3.11 R包dslabs简介 52

3.12 生成Python数据集 53

3.13 生成R数据集 55

3.14 总结 56

3.15 问题回顾及练习 56

第4章 数据可视化 59

4.1 数据可视化的重要性 59

4.2 R数据可视化 60

4.3 Python数据可视化 66

4.4 Julia数据可视化 69

4.5 绘制简单图形 71

4.5.1 各种条状图、饼图和

直方图 74

4.5.2 添加趋势 75

4.5.3 添加图解和其他说明 76

4.6 R可视化包 79

4.7 Python可视化包 81

4.8 Julia可视化包 82

4.9 动态可视化 83

4.9.1 将图片存储为pdf 86

4.9.2 将动态可视化存储

为HTML文件 86

4.10 总结 87

4.11 问题回顾及练习 87

第5章 在Anaconda中统计建模 90

5.1 线性模型简介 91

5.2 在R、Python、Julia和Octave

中运行线性回归 92

5.3 临界值和决策规则 96

5.4 F检验、临界值和决策规则 97

5.5 处理缺失数据 104

5.5.1 清除缺失数据 104

5.5.2 用其他值替换缺失

数据 105

5.6 检测及处理异常值 106

5.7 几个多元线性模型 108

5.8 共线性及其解决方案 111

5.9 一个模型的性能测量 113

5.10 总结 113

5.11 问题回顾及练习 113

第6章 管理包 117

6.1 包、模块和工具箱简介 118

6.2 使用包的两个示例 118

6.3 查找所有R包 123

6.4 查找所有Python包 124

6.5 查找所有Julia包 125

6.6 查找所有Octave包 126

6.7 R中的任务视图 126

6.8 查找手册 128

6.9 包依赖 129

6.10 R包管理 130

6.11 Python包管理 132

6.12 Julia包管理 133

6.13 Octave包管理 134

6.14 包管理器conda 135

6.15 在R和Python中创建

程序集 137

6.16 查找环境变量 138

6.17 总结 140

6.18 问题回顾及练习 140

第7章 Anaconda的优化 142

7.1 为何优化很重要 142

7.2 优化的一般问题 144

7.3 二次优化 148

7.3.1 R中的优化 149

7.3.2 Python中的优化 151

7.3.3 Julia中的优化 153

7.3.4 Octave中的优化 156

7.4 股票投资组合优化 159

7.5 *优的税收政策 161

7.6 R中用于优化的包 162

7.7 Python中用于优化的包 164

7.8 Octave中用于优化的包 165

7.9 Julia中用于优化的包 165

7.10 总结 166

7.11 问题回顾及练习 166

第8章 Anaconda中的无监督学习 168

8.1 无监督学习简介 169

8.2 层次聚类 173

8.3 k-均值聚类 177

8.4 Python包scipy简介 179

8.5 Python包contrastive简介 181

8.6 Python包sklearn(scikit-learn)

简介 181

8.7 R包rattle简介 185

8.8 R包randomUniformForest

简介 187

8.9 R包Rmixmod简介 189

8.10 Julia实现 190

8.11 聚类分析的任务视图 191

8.12 总结 192

8.13 问题回顾及练习 192

第9章 Anaconda中的监督学习 194

9.1 监督学习概览 194

9.2 分类 199

9.2.1 k-*近邻算法 200

9.2.2 贝叶斯分类器 202

9.2.3 强化学习 204

9.3 监督学习的R实现 205

9.4 Python实现 209

9.5 Octave实现 213

9.6 Julia实现 217

9.7 总结 219

9.8 问题回顾及练习 220

第 10章 数据预测分析:建模和验证 223

10.1 理解数据预测分析 223

10.2 有用的数据集 224

10.2.1 R包AppliedPredictive

Modeling 226

10.2.2 时间序列分析 228

10.3 预测未来事件 229

10.3.1 季节性 232

10.3.2 可视化组件 233

10.3.3 R包LiblineaR 234

10.3.4 R包datarobot 236

10.3.5 R包eclust 236

10.4 模型选择 238

10.4.1 Python包model-

catwalk 240

10.4.2 Python包sklearn 240

10.4.3 Julia包QuantEcon 242

10.4.4 Octave包ltfat 243

10.5 Granger因果关系检验 245

10.6 总结 247

10.7 问题回顾及练习 247

第 11章 Anaconda云 250

11.1 Anaconda云简介 250

11.2 深入学习Jupyter Notebook 251

11.2.1 Jupyter Notebook

格式 254

11.2.2 Notebooks分享 256

11.2.3 项目分享 258

11.2.4 环境分享 260

11.3 复制他人的环境到本地 261

11.4 总结 265

11.5 问题回顾及练习 265

第 12章 分布式计算、并行计算和

HPCC 267

12.1 分布式和并行计算简介 267

12.1.1 并行处理的任务视图 268

12.1.2 Python示例程序 269

12.2 理解MPI 270

12.2.1 R包Rmpi 270

12.2.2 R包plyr 271

12.2.3 R包parallel 272

12.2.4 R包snow 276

12.3 Python并行处理 276

12.3.1 单词频率的并行

处理 278

12.3.2 Monte-Carlo期权定价

并行处理 278

12.4 计算节点 280

12.5 Anaconda附加组件 280

12.6 HPCC简介 281

12.7 总结 283

12.8 问题回顾及练习 283

展开全部

Anaconda数据科学实战 作者简介

严玉星博士毕业于麦吉尔大学,获得金融学博士学位。他曾在加拿大、新加坡和美国的8 所大学教授各种金融课程,发表23篇研究和教学相关的论文,并著有6本书。此外,他还精通R、Python、SAS、MATLAB、Octave 和C 语言,是金融数据分析方面的专家。 詹姆斯·严当前在多伦多大学攻读计算机科学和统计学双学位。他还精通Python、R、Java、MATLAB 和SQL等。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服