4.23文创礼盒,买2个减5元
欢迎光临中图网 请 | 注册
> >>
pandas数据预处理详解

pandas数据预处理详解

作者:Lombard
出版社:中国水利水电出版社出版时间:2021-10-01
开本: 其他 页数: 656
中 图 价:¥88.3(6.9折) 定价  ¥128.0 登录后可看到会员价
加入购物车 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
本类五星书更多>

pandas数据预处理详解 版权信息

  • ISBN:9787517098980
  • 条形码:9787517098980 ; 978-7-5170-9898-0
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>>

pandas数据预处理详解 本书特色

Python是一款非常强大、易学易用的数据处理和数据分析工具,而大量第三方软件库的支持,更是使其成为人工智能时代非常重要的编程工具。pandas就是一款非常重要的基于NumPy的Python数据分析软件库,它提供了大量能快速便捷处理数据的函数和方法,提供了高效操作大型数据集的工具,通过pandas和Python,可以顺利完成数据科学、机器学习或日常工作中的几乎所有数据分析任务。本书就利用pandas,结合简单易懂的示例代码,对机器学习和数据科学领域数据预处理的知识和各种预处理方法进行了透彻、全面的讲解。学完本书,你会发现Python之所以在数据处理和分析领域如此强大,pandas是其重要的影响因素之一。 1.用浅显易懂的语言,全面介绍pandas的使用方法和应用技巧。 2.用简洁清晰的代码,结合日常工作中需要处理数据的实际场景,学习pandas的实际用法,掌握解决实际问题的方法。 3.644页知识讲解,可作为初学者系统学习pandas的入门书,也可作为资深工程师的案头手册随时翻阅查看。 4.双色印刷+精美排版,学习过程轻松愉悦,学习效率更高。

pandas数据预处理详解 内容简介

Python 因其拥有强大的第三方软件库,广泛应用在人工智能开发、科学计算和数据分析中。而 pandas 就是一款基于 NumPy 的解决 Python 数据分析任务的软件库。在机器学习和数据科学中,因为很少有数据可以直接使用,所以对数据进行预处理就成为必不可少的工作。《Pandas 数据预处理详解》就利用数据处理必需的 pandas 库,从 pandas 基本操作、数据结构,到 pandas 将执行的各种任务,如汇总统计信息、检查缺失值 / 异常值 / 重复数据以及合并和分组数据等,通过简单易懂的示例,对预处理的基础知识和各种预处理方法进行了透彻讲解。学完本书,读者将能够顺利执行各种机器学习和数据分析任务。特别适合作为机器学习工程师、数据科学及科研工作者初学数据预处理的参考书,也适合作为案头手册,随时翻阅查看。

pandas数据预处理详解 目录

第1章 pandas的概要与Python的基本操作 1.1 机器学习领域中的刚需库——pandas 1.1.1 何谓pandas 1.1.2 pandas的主要功能 1.2 构建pandas的使用环境 1.2.1 三种构建环境下的工具包和软件 1.2.2 在Windows操作系统中构建 1.2.3 在macOS中安装程序 1.2.4 Google Colab平台 1.3 Python的数据结构 1.3.1 为何在机器学习中使用Python 1.3.2 变量 1.3.3 运算符 1.3.4 动态类型 1.3.5 数值类型 1.3.6 字符串类型 1.3.7 元组 1.3.8 列表 1.3.9 字典 1.3.10 集合 1.4 Python的基本操作 1.4.1 if语句 1.4.2 while语句 1.4.3 for语句 1.4.4 break语句与continue语句 1.4.5 函数 1.5 Jupyter Notebook的基本操作 1.5.1 代码补全功能 1.5.2 对象类型信息查看 1.5.3 魔法命令 第2章 pandas的数据结构 2.1 Series 2.1.1 Series的概要 2.1.2 Series的基本操作 2.2 DataFrame对象 2.2.1 DataFrame对象的概要 2.2.2 DataFrame的基本操作 2.3 索引 2.3.1 索引的概要 2.3.2 索引的基本操作 2.4 pandas的初次接触 2.4.1 数据集的概要 2.4.2 数据的读人 2.4.3 数据的显示 2.4.4 数据的引用 2.4.5 数据的排序 2.4.6 缺失数据的处理 2.4.7 数据的分组 2.4.8 数据的合并 2.4.9 数据的可视化 第3章 数据的应用于读取 3.1 数据的引用 3.1.1 引用数据的方法 3.1.2 切片 3.1.3 属性的引用 3.1.4 bool类型的引用 3.1.5 where方法 3.1.6 query方法 3.2 文件的读取与写入 3.2.1 CSV 3.2.2 Excel 3.2.3 JSON 3.2.4 HDF5 第4章 数据的聚合与排序 4.1 数据的聚合 4.1.1 *小值与*大值 4.1.2 平均值、中位数和众数 4.1.3 标准差 4.1.4 分位数 4.1.5 累积和与累积积 4.1.6 分箱处理 4.1.7 概括统计量 4.1.8 数据透视表 4.1.9 交叉表 4.2 数据的排序 4.2.1 基于标签的排序 4.2.2 基于元素的排序 第5章 数据变形 5.1 行和列的添加与删除 5.1.1 添加行和列 5.1.2 删除行和列 5.2 数据的连接与合并 5.2.1 concat函数 5.2.2 merge函数 5.3 其他的数据变形 5.3.1 随机抽样 5.3.2 虚拟变量 5.3.3 长型数据和宽型数据的变形 第6章 缺失值、离群值和重复数据 6.1 缺失值 6.1.1 pandas与缺失数据 6.1.2 缺失值的确认 6.1.3 缺失值的删除 6.1.4 缺失值的置换 6.2 离群值 6.2.1 何谓离群值 6.2.2 z分数 6.2.3 四分位距 6.2.4 箱形图 6.3 重复数据 6.3.1 重复数据的检测 6.3.2 重复数据的删除 第7章 函数应用与分组化 7.1 函数处理 7.1.1 apply方法 7.1.2 DataFrame类和Series类的agg方法 7.1.3 applymap方法 7.1.4 pipe方法 7.2 基于for语句的循环处理 7.2.1 Series对象的循环处理 7.2.2 DataFrame对象的循环处理 7.3 数据的分组 7.3.1 GroupBy对象 7.3.2 GroupBy对象的agg方法 7.3.3 transfom方法 7.3.4 apply方法 第8章 其他操作 8.1 字符串操作 8.1.1 str属性 8.1.2 字符串的分割 8.1.3 字符串的替换 8.1.4 字符串的提取 8.1.5 字符串的模式匹配 8.1.6 从字符串到虚拟变量 8.2 数据的可视化 8.2.1 plot方法 8.2.2 条形图 8.2.3 直方图 8.2.4 散点图 8.2.5 饼形图 8.2.6 箱形图 8.2.7 散点图矩阵 8.2.8 缺失值的处理 8.3 多重索引 8.3.1 多重索引的基本操作 8.3.2 多重索引的统计 8.3.3 多重索引的连接与合并 8.4 时间序列数据 8.4.1 datetime模块 8.4.2 处理pandas时间序列数据的对象 8.4.3 时间序列数据的索引引用 8.4.4 时间序列数据的转换 第9章 数据分析的基础 9.1 探索性数据分析 9.1.1 数据结构的确认 9.1.2 缺失值、离群值和重复数据的确认 9.1.3 基于数据可视化的确认 9.2 整齐数据 9.2.1 整齐数据的概要 9.2.2 将杂乱数据转换成整齐数据 9.3 数据分析实例——基于Bank Marketing数据集 9.3.1 数据集的概要和数据结构 9.3.2 数据的基本信息 9.3.3 客户数据分析 9.3.4 营销活动数据分析
展开全部

pandas数据预处理详解 作者简介

Lombard 增田 秀人Lombard公司AI战略室 室长 先后在旧金山和东南亚创业,于2017年创建了机器学习学校"codexa"。企业培训讲师,曾在xPython Meet Up &Conference 2019发表演讲。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服