欢迎光临中图网 请 | 注册
> >>
R语言核心技术手册-第2版

R语言核心技术手册-第2版

作者:阿德勒
出版社:电子工业出版社出版时间:2014-07-01
开本: 16开 页数: 656
中 图 价:¥76.2(7.7折) 定价  ¥99.0 登录后可看到会员价
暂时缺货 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
本类五星书更多>

R语言核心技术手册-第2版 版权信息

  • ISBN:9787121237867
  • 条形码:9787121237867 ; 978-7-121-23786-7
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>>

R语言核心技术手册-第2版 本书特色

r 是一款优秀的开源统计应用语言,它直观、易用、低成本,而且还有庞大的社区支持,随着数据挖掘技术的兴起,r 语言得到了广泛的应用。《r语言核心技术手册(第2版)》介绍从安装r 软件到基本语法以及应用的全过程,可以帮助你全面地学习和使用r。《r语言核心技术手册(第2版)》共6部分,26 章,基本涵盖了r 语言的所有功能,而且提供了大量的实例说明运用r 语言绘图、分析数据以及拟合统计模型的过程。书中虽然涉及很多统计学理论和知识,但并不是《r语言核心技术手册(第2版)》的重点。 作为第2 版,本书增加了一些处理数据的新章节,将绘图章节集中放在“可视化篇”,同时针对r 的版本变化做了一些升级。 《r语言核心技术手册(第2版)》适合从事数据挖掘、机器学习、统计及数据分析的人士阅读。

R语言核心技术手册-第2版 内容简介

如果你打算用r进行统计计算和数据可视化,本书就是关于使用开源r语言(软件环境)快速解决上述问题的实用指导教程。通过本书,你将学会如何编写r函数以及借助r包进行数据预处理、可视化以及数据分析。作者用取自制医学、商业和体育领域的丰富案例对上述问题进行了讲解。 √ 多达数百个实例的r教程,快速入门r语言 √ 探索r语言的语法、对象和其他语言细节 √ 在网站上可找到包括bioconductor在内的数千个用户共享的r包 √ 学习如何用r完成数据分析预处理 √ 基于r graphics、lattice和ggplot2包 进行数据可视化 √ 使用r语言计算概率分布、统计检验以及拟合模型 √ 基于hadoop并行编程提升大规模运算的效率 √ 学习r语言的完整参考手册 第二版的内容依据r 2.14和r 2.15进 行了更新,并新增了r高性能计算、基于ggplot2的数据可视化和利用hadoop做并行运算等章节。

R语言核心技术手册-第2版 目录

前言 xvi

i 基础篇

第1 章获取和安装r 3

r 版本3

r 的安装3

windows 4

mac os x 5

linux 和unix 系统5

第2 章r 的用户界面 7

r 的图形用户界面7

windows 8

mac os x 8

linux 和unix 程序9

r 控制台11

命令行编辑13

批处理模式14

在excel 中使用r 15

rstudio 17

其他运行r 的方式17

第3 章简短的示例 19

基本操作19

函数21

变量22

数据结构简介25

对象和类28

模型和公式30

图表32

获得帮助37

第4 章r 包 39

r 包概览39

列示本地库中的r 包40

加载r 包42

在windows 和linux 系统下加载r 包42

在mac os x 系统下加载r 包42

搜索r 包资源库43

搜索网络上的r 包资源库44

基于r 界面搜寻和安装包44

从其他资源库安装r 包47

定制r 包47

创建包目录48

创建r 包49

ii 语言篇

第5 章r 语言概览 53

表达式53

对象54

符号54

函数55

在赋值语句中,对象会被复制56

r 中一切皆为对象57

特殊值58

na 58

inf 和-inf 58

nan 59

null 59

强制转换59

r 解释器60

观察r 是如何工作的62

第6 章r 语法65

常量65

数值向量65

字符向量67

符号67

运算符69

运算顺序70

赋值操作71

表达式72

分离型表达式72

括号72

花括号73

控制结构74

条件语句74

循环75

访问数据结构79

数据结构操作符79

通过整数向量引用79

通过逻辑向量引用82

通过名字进行引用83

r 编程标准84

第7 章r 对象 86

基本对象类型86

向量89

列表91

其他对象91

矩阵92

数组92

因子93

数据框95

公式96

时间序列98

shingle 对象99

日期和时间对象100

连接对象100

属性101

类104

第8 章符号和环境 106

符号106

环境107

全局环境108

环境和函数109

调用堆栈109

在不同的环境中对函数求值110

向环境中添加对象113

异常113

提示错误114

捕获错误115

第9 章函数 117

函数的关键字117

参数117

返回值119

函数参数119

匿名函数120

函数的属性122

参数顺序和具名实参124

副作用125

改变其他环境125

输入/输出126

图形126

第10 章面向对象编程 127

r 的面向对象编程概览128

核心概念128

实现的例子129

r 的面向对象编程:s4 135

类的定义135

对象的新建137

槽的存取138

对象的操作138

创建强制转换方法138

方法139

方法的管理140

基本类型141

更多的帮助142

守旧派的oop:s3 142

s3 的类143

s3 方法144

在s4 的类中使用s3 的类145

查找隐藏的s3 方法145

iii 数据篇

第11 章数据的存取和编辑 149

在r 中输入数据149

用r 命令输入数据149

用图形界面输入数据150

保存和读入r 对象153

用save 保存对象153

从外部文件导入数据154

文本文件155

其他软件163

导出数据164

从数据库获取数据164

导出然后导入165

数据库连接包165

rodbc 166

dbi 177

tsdbi 181

从hadoop 中获取数据182

第12 章准备数据 183

合并数据集183

粘贴数据结构184

通过共同字段合并数据188

数据转换189

变量重新赋值190

转换函数190

对对象的每个元素进行函数运算191

数据分段197

shingle 197

cut 197

利用分组变量合并对象198

子集199

中括号索引的方式199

subset 函数200

随机抽样200

汇总函数202

tapply 与aggregate 202

用rowsum 聚合表格205

计数206

数据修整209

数据清洗218

查找和删除重复数据219

排序219

iv 可视化篇

第13 章图形 225

r graphics 概述225

散点图226

时间序列231

柱状图233

饼图238

分类数据绘图239

三维数据245

绘制分布图252

箱线图256

画图设备259

自定义图形260

绘图函数常见参数260

图形参数260

基本图形函数271

第14 章lattice 绘图280

历史280

lattice 包概述281

lattice 的工作原理281

例子281

使用lattice 函数284

定制面板函数285

高级lattice 函数286

单一的网格作图287

二元网格作图312

三元图321

其他图形326

定制lattice 图328

lattice 函数的常用参数328

trellis.skeleton 329

指定如何绘制坐标轴330

参数331

plot.trellis 336

strip.default 337

simplekey 338

低级函数339

低级绘图函数339

面板函数340

第15 章ggplot2 341

一个简短的介绍341

图形语法345

一个更复杂的例子:医保数据350

快速绘图360

用ggplot2 绘图361

更多信息365

v 统计篇

第16 章数据分析369

描述性统计369

相关系数和协方差372

主成分分析375

因子分析379

bootstrap 重抽样380

第17 章概率分布382

正态分布382

常见分布的参数384

分布函数族385

第18 章统计检验389

连续型数据390

基于正态分布的检验390

不依赖分布的检验405

离散数据408

比例检验408

二项式检验409

列联表检验410

列联表非参数检验416

第19 章功效检验417

实验设计示例417

t 检验实验设计418

比例实验设计419

方差分析设计420

第20 章回归模型422

简单的线性模型示例422

拟合模型424

指定模型的工具函数425

获取模型信息425

更新模型431

lm 函数的详述432

*小二乘回归的假设434

稳健回归和阻力回归436

子集选取和shrinkage 回归438

变量的逐步选取438

岭回归439

lasso 和*小角回归440

弹性网络442

主成分回归和偏*小二乘回归442

非线性模型443

广义线性模型443

glmnet 包446

非线性*小二乘449

生存模型450

平滑456

样条线456

拟合多项式曲面458

核平滑459

回归的机器学习算法460

回归树模型462

mars 算法473

神经网络479

投影寻踪回归483

广义可加模型486

支持向量机488

第21 章分类模型 490

线性分类模型490

logistic 回归490

线性判别分析495

对数线性模型499

机器学习分类模型500

k 近邻500

分类树模型502

神经网络506

支持向量机507

随机森林507

第22 章机器学习509

购物篮分析509

聚类514

距离度量514

聚类算法515

第23 章时间序列分析519

自相关函数519

时间序列模型520

vi 其他主题

第24 章优化r 程序性能527

r 程序性能的测量527

时间测定527

性能分析528

监控内存的使用530

内存性能分析531

优化你的r 代码531

使用向量操作531

r 中查找的性能534

使用数据库查询大数据集541

内存预分配541

清理内存541

大数据集的函数543

加速r 的其他方法543

r 字节码编译器543

高性能的r 版本546

第25 章bioconductor 551

例子552

加载原始的表达数据552

从geo 读取数据557

匹配表型数据559

分析表达数据560

关键的bioconductor 包564

数据结构568

eset 568

assaydata 570

annotateddataframe 571

miame 571

bioconductor 包使用的其他类572

如何进一步学习573

bioconductor 之外的资源574

教程574

课程574

相关图书575

第26 章r 和hadoop 576

r 和hadoop 576

hadoop 简介577

rhadoop 582

hadoop streaming 597

了解更多600

一些其他的用r 做并行计算的包601

segue 601

domc 602

从哪里我们可以了解更多602

参考文献603

索引606
展开全部

R语言核心技术手册-第2版 相关资料

r是一种免费且功能强大的语言,但不易入门。本书是学习r语言的不二之选,是每个数据科学家必备的案头参考书。
—— dj patil
greylock公司房产领域数据科学家
r迅速蹿红为数据分析的通用语言,本书堪称是学习r语言的最佳入门书籍。它涵盖了包括数据可视化、时间序列分析等在内的数据科学能包罗的所有领域。
—— anthony goldbloom
kaggle公司创始人兼ceo

R语言核心技术手册-第2版 作者简介

作者:约瑟夫?阿德勒(Joseph Adler)拥有多年数据挖掘和数据分析经验,曾就职于DoubleClick、美国运通和VeriSign公司。约瑟夫毕业于麻省理工学院,期间取得了计算机科学和电子工程的学士及硕士学位。他拥有多项计算机安全和密码学领域的专利,并且是《棒球技巧》(Baseball Hacks)的作者。目前,他在LinkedIn公司任高级数据科学家。 译者:刘思喆 中国人民大学统计学院科班出身,国内资深R领域专家,拥有10 年R 语言使用经验,中国R 语言会议联合发起人。《153 分钟学会R》作者,《R reference card》译者。“统计之都” 理事会成员,R 语言版版主;电信、互联网、彩票行业资深数据挖掘专家。CSDN 大数据技术论坛、DATA World Forum、中国人民大学数据挖掘中心特邀讲师。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服