Python数据分析 版权信息
- ISBN:9787564188849
- 条形码:9787564188849 ; 978-7-5641-8884-9
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
Python数据分析 本书特色
《Python数据分析》将服务于初露头角的数据科学家和开发人员,让他们有兴趣发展自己的技能,或者任何希望成为一名专业数据科学家的人。
本书提供了一种新的数据分析方法,与你分享全新、强大的Python工具、AI技术和开源库。行业专家大卫??塔伊布向你展示如何将数据科学与Python编程和算法的强大功能联系起来。你将在数据分析中使用复杂的算法和*先进的人工智能技术,了解如何使用Python工具和Jupyter Notebook通过实践案例分析数据,还可以找到理论和实践之间的正确平衡,以及大量可以直接集成到自己的数据项目中的代码文件。
Python数据分析 内容简介
本书《Python数据分析》提供了一种新的数据分析方法,与你分享近期新不错大的Python工具、AI技术和开源库。行业专家大卫?塔勒布向你展示如何将数据科学与Python编程算法的强大功能联系起来。你将在数据分析中使用复杂的算法和优选进的人工智能技术。了解如何在实践案例分析数据中使用Python工具和Jupyter笔记本。还可以体会理论和实践的适当平衡,以及大量可以直接集成到自己数据项目中的代码文件。
Python数据分析 目录
1 编程和数据科学——一个新的工具集
什么是数据科学
数据科学会长期存在吗?
为什么数据科学正在兴起?
数据科学与开发人员有什么关系?
将这些概念付诸实践
深入研究一个具体的示例
数据管道蓝图
数据科学家应该具备什么技能?
IBM Watson Deep QA
回到Twitter带#标签的情感分析项目
从构建**条企业级数据管道中汲取的经验教训
数据科学策略
Jupyter Notebook是我们的战略核心
为什么Notebook这么流行?
本章小结
2 Python和Jupyter Notebook为数据分析提供动力
为什么选择Python?
PixieDust入门
SampleData——一个用于加载数据的简单API
用pixiedust_rosie整理数据
Disp|ay——一个简单的交互式数据可视化API
过滤
用PixieApp消除开发人员和数据科学家之间的壁垒
操作化数据科学分析的体系结构
本章小结
3 使用Python库加速数据分析
PixieAPP深度剖析
路由
生成路由请求
GitHub项目跟踪示例程序
在表格中显示搜索结果
使用pd_entity属性调用PixieDust display()API
使用pd_script调用任意Python代码
用pd_refresh让应用程序更具响应性
创建可重用的小部件
本章小结
4 用PixieApp工具发布数据分析结果
Kubernetes概述
安装和配置PixieGateway服务器
PixieGateway服务器配置
PixieGateway体系结构
发布应用程序
PixieApp URL中的编码状态
通过将图表发布为网页来共享它们
PixieGateway管理控制台
Python控制台
显示PixieApp的预热和运行代码
本章小结
5 Python和PixieDust*佳实践与高级概念
使用@captureOutput装饰器集成第三方Python库的输出
使用@captureOutput创建词云图像
增加模块化和代码重用
使用pd widget创建小部件
PixieDust中的流式数据支持
向PixieApp添加流处理功能
添加带有PixieApp事件的仪表盘下钻功能
扩展PixieDust可视化
调试
使用pdb调试Jupyter Notebook
使用PixieDebugger进行可视化调试
使用PixieDebugger调试PixieApp路由
使用PixieDust日志记录排除问题
客户端调试
在Python笔记本中运行Node.js
本章小结
6 分析案例:人工智能与TensorFlow图像识别
什么是机器学习?
什么是深度学习?
开始使用TensorFlow
用DNNClassifier进行简单分类
图像识别示例应用程序
第1部分——加载预训练的MobileNet模型
第2部分——为我们的图像识别示例应用程序创建一个PixieAPP
第3部分——集成TensorBoard图形可视化
第4部分——使用自定义训练数据重新训练模型
本章小结
7 分析案例:自然语言处理、大数据与Twitter情感分析
ApacheSpark入门
Apache Spark体系结构
将Notebook配置为使用Spark
“Twitter情感分析”应用程序
第1部分——以Spark Structured Streaming获取数据
数据管道的体系结构图
Twitter的身份验证
创建Twitter流
创建Spark Streaming DataFrame
创建和运行结构化查询
监控活动流式查询
从Parquet文件创建批量DataFrame
第2部分——用情感和提取的*相关实体来丰富数据
IBM Watson Natural Language Undersanding服务入门
第3部分——创建实时仪表盘
将分析重构为它们自己的方法
创建PixieApp
第4部分——使用Apache Kafka和IBM Streams Designer添加可伸缩性
将原始推文流到Kafka
使用Streaming Analytics服务丰富推文数据
使用Kafka输入源创建Spark Streaming DataFrame
本章小结
8 分析案例:预测——金融时间序列分析与预测
NumPy入门
创建NumPy数组
ndarray运算
NumPy数组的选择操作
广播
时间序列的统计探索
虚拟投资
自相关函数(ACF)和偏自相关函数(PACF)
将它们与StockExplorer PixieAPP放在一起
BaseSuhAPP——所有子PixieAPP的基类
StockExploreSubAPP——**个子PixieApp
MovingAverageSubAPP——第二个子PixieAPP
AutoCorrelationsubAPP——第三个子PixieApp
ARIMA模型在时间序列预测中的应用
建立MSFT股票时间序列的ARIMA模型
StockExplorer PixieAPP第2部分——使用ARIMA模型添加时间序列预测
本章小结
9 分析案例:图形算法——美国国内航班数据分析
图形概述
图形表示
图形算法
图形和大数据
networkx图形库入门
创建图形
可视化图形
第1部分——将美国国内航班数据加载到图中
图的中心性
第2部分——创建UsFlightsAnalysis PixieApp
第3部分——向USFlightsAnalysis PiXieApp添加数据探索功能
第4部分——创建预测航班延误的ARIMA模型
本章小结
10 数据分析的未来与拓展技能的途径
前瞻性思考——人工智能与数据科学的未来展望
参考资料
附录 PixieApp快速参考
注释
自定义HTML属性
方法
展开全部
Python数据分析 作者简介
David Taieb目前在亚马逊担任Principal Engineer(首席工程师),之前在IBM工作14年。曾经是IBM Watson和云平台开发人员布道师团队的Distinguished Engineer(杰出工程师),领导一个技术专家组团队向开发人员宣传数据科学、人工智能和云技术。他著名的开源项目是PixieDust Python库,致力于增强Jupyter笔记本可视化功能、支持scala spark与pyspark交互性,帮助开发人员提高工作效率。