读书月福利
欢迎光临中图网 请 | 注册

数据科学入门

作者:格鲁斯
出版社:人民邮电出版社出版时间:2016-03-01
开本: 16开 页数: 284
中 图 价:¥33.8(4.9折) 定价  ¥69.0 登录后可看到会员价
暂时缺货 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口
有划线标记、光盘等附件不全详细品相说明>>
本类五星书更多>

数据科学入门 版权信息

数据科学入门 本书特色

本书基于易于理解且具有数据科学相关的丰富的库的python语言环境,从零开始讲解数据科学工作。具体内容包括:python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,k近邻法,朴素贝叶斯算法,等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念,详细展示了什么是数据科学。

数据科学入门 内容简介

介绍数据科学基本知识的重量级读本,google数据科学家作品。 数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。 作者选择了功能强大、简单易学的python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在github上下载。通过阅读本书,你可以:学到一堂python速成课;学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深入理解机器学习的基础;运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语言处理、网络分析、mapreduce和数据库。    

数据科学入门 目录

第1章 导论  11.1 数据的威力  11.2 什么是数据科学  11.3 激励假设:datasciencester  21.3.1 寻找关键联系人  31.3.2 你可能知道的数据科学家  51.3.3 工资与工作年限  81.3.4 付费账户  101.3.5 兴趣主题  111.4 展望  12第2章 python速成  132.1 基础内容  132.1.1 python获取  132.1.2 python之禅  142.1.3 空白形式  142.1.4 模块  152.1.5 算法  162.1.6 函数  162.1.7 字符串  172.1.8 异常  182.1.9 列表  182.1.10 元组  192.1.11 字典  202.1.12 集合  222.1.13 控制流  232.1.14 真和假  242.2 进阶内容  252.2.1 排序  252.2.2 列表解析  252.2.3 生成器和迭代器  262.2.4 随机性  272.2.5 正则表达式  282.2.6 面向对象的编程  282.2.7 函数式工具  292.2.8 枚举  312.2.9 压缩和参数拆分  312.2.10 args 和kwargs  322.2.11 欢迎来到datasciencester  332.3 延伸学习  33第3章 可视化数据  343.1 matplotlib  343.2 条形图  363.3 线图  403.4 散点图  413.5 延伸学习  44第4章 线性代数  454.1 向量  454.2 矩阵  494.3 延伸学习  51第5章 统计学  535.1 描述单个数据集  535.1.1 中心倾向  555.1.2 离散度  565.2 相关  585.3 辛普森悖论  605.4 相关系数其他注意事项  615.5 相关和因果  625.6 延伸学习  63第6章 概率  646.1 不独立和独立  646.2 条件概率  656.3 贝叶斯定理  666.4 随机变量  686.5 连续分布  686.6 正态分布  696.7 中心极限定理  726.8 延伸学习  74第7章 假设与推断  757.1 统计假设检验  757.2 案例:掷硬币  757.3 置信区间  797.4 p-hacking  807.5 案例:运行a/b测试  817.6 贝叶斯推断  827.7 延伸学习  85第8章 梯度下降  868.1 梯度下降的思想  868.2 估算梯度  878.3 使用梯度  908.4 选择正确步长  908.5 综合  918.6 随机梯度下降法  928.7 延伸学习  93第9章 获取数据  949.1 stdin和stdout  949.2 读取文件  969.2.1 文本文件基础  969.2.2 限制的文件  979.3 网络抓取  999.3.1 html 和解析方法  999.3.2 案例:关于数据的o'reilly图书  1019.4 使用api  1059.4.1 json(和xml)  1059.4.2 使用无验证的api  1069.4.3 寻找api  1079.5 案例:使用twitter api  1089.6 延伸学习  111第10章 数据工作  11210.1 探索你的数据  11210.1.1 探索一维数据  11210.1.2 二维数据  11410.1.3 多维数据  11610.2 清理与修改  11710.3 数据处理  11910.4 数据调整  12210.5 降维  12310.6 延伸学习  129第11章 机器学习  13011.1 建模  13011.2 什么是机器学习  13111.3 过拟合和欠拟合  13111.4 正确性  13411.5 偏倚- 方差权衡  13611.6 特征提取和选择  13711.7 延伸学习  138第12章 k近邻法  13912.1 模型  13912.2 案例:*喜欢的编程语言  14112.3 维数灾难  14612.4 延伸学习  151第13章 朴素贝叶斯算法  15213.1 一个简易的垃圾邮件过滤器  15213.2 一个复杂的垃圾邮件过滤器  15313.3 算法的实现  15413.4 测试模型  15613.5 延伸学习  158第14章 简单线性回归  15914.1 模型  15914.2 利用梯度下降法  16214.3 *大似然估计  16214.4 延伸学习  163第15章 多重回归分析  16415.1 模型  16415.2 *小二乘模型的进一步假设  16515.3 拟合模型  16615.4 解释模型  16715.5 拟合优度  16715.6 题外话:bootstrap  16815.7 回归系数的标准误差  16915.8 正则化  17015.9 延伸学习  172第16章 逻辑回归  17316.1 问题  17316.2 logistic函数  17616.3 应用模型  17816.4 拟合优度  17916.5 支持向量机  18016.6 延伸学习  184第17章 决策树  18517.1 什么是决策树  18517.2 熵  18717.3 分割之熵  18917.4 创建决策树  19017.5 综合运用  19217.6 随机森林  19417.7 延伸学习  195第18章 神经网络  19618.1 感知器  19618.2 前馈神经网络  19818.3 反向传播  20118.4 实例:战胜captcha  20218.5 延伸学习  206第19章 聚类分析  20819.1 原理  20819.2 模型  20919.3 示例:聚会  21019.4 选择聚类数目k  21319.5 示例:对色彩进行聚类  21419.6 自下而上的分层聚类  21619.7 延伸学习  221第20章 自然语言处理  22220.1 词云  22220.2 n-grams模型   22420.3 语法  22720.4 题外话:吉布斯采样  22920.5 主题建模  23120.6 延伸学习  236第21章 网络分析  23721.1 中介中心度  23721.2 特征向量中心度  24221.2.1 矩阵乘法  24221.2.2 中心度  24421.3 有向图与pagerank  24621.4 延伸学习  248第22章 推荐系统  24922.1 手工甄筛  25022.2 推荐流行事物  25022.3 基于用户的协同过滤方法  25122.4 基于物品的协同过滤算法  25422.5 延伸学习  256第23章 数据库与sql  25723.1 create table与insert  25723.2 update  25923.3 delete  26023.4 select  26023.5 group by  26223.6 order by  26423.7 join  26423.8 子查询  26723.9 索引  26723.10 查询优化  26823.11 nosql  26823.12 延伸学习  269第24章 mapreduce  27024.1 案例:单词计数  27024.2 为什么是mapreduce  27224.3 更加一般化的mapreduce  27224.4 案例:分析状态更新  27324.5 案例:矩阵计算  27524.6 题外话:组合器  27624.7 延伸学习  277第25章 数据科学前瞻  27825.1 ipython  27825.2 数学  27925.3 不从零开始  27925.3.1 numpy  27925.3.2 pandas  28025.3.3 scikit-learn  28025.3.4 可视化  28025.3.5 r  28125.4 寻找数据  28125.5 从事数据科学  28125.5.1 hacker news  28225.5.2 消防车  28225.5.3 t 恤  28225.5.4 你呢?  283作者简介  284关于封面  284
展开全部

数据科学入门 相关资料

“joel grus带你踏上数据科学的探索之旅,让你从对数据的好奇飞跃到通透理解每个数据科学家都应知道的实用算法。"——rohit sivaprasad,soylent公司数据科学家,datatau.com

数据科学入门 作者简介

Joel Grus是Google的一位软件工程师,曾于数家创业公司担任数据科学家。目前住在西雅图,专注于数据科学工作并乐此不疲。偶尔在joelgrus.com发表博客,长期活跃于Twitter @joelgrus。

商品评论(0条)
暂无评论……
书友推荐
编辑推荐
返回顶部
中图网
在线客服