小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
《数据挖掘技术及其应用(精)》(作者杨杰、姚莉秀)系统地讲述了数据挖掘的基本概念和基本原理,并列举了在相应领域具有参考价值的算法及其改进和应用,是作者多年来从事教学和科研实践的成果。全书共9章,主要内容有:数据挖掘的基本概念和原理,数据预处理,各种分类、聚类和关联规则提取算法,以及在生物信息学、材料学中的实际应用案例。 《数据挖掘技术及其应用(精)》可用作计算机专业本?高年级学生或研究生的教材或参考书,也可供从事计算机信息处理、
本书共16章,分三个部分:基础篇、实战篇、提高篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。高级篇介绍了基于R语言二次开发的数据挖掘应用软件,使读者体验到数据挖掘二次的开发的魅力...
matlab官方(mathworks)资深大数据挖掘专家撰写,mathworks官方及多位专家鼎力推荐从技术、方法、案例、最佳实践4个维度循序渐进地讲解了大数据挖掘技...
本书第一章讲了云计算及计算机存储系统的相关概念,发展历史等方面知识。旨在以综述的方式使读者了解云存储方面背景知识。因为建立分布式存储系统首先需要考虑该系统的可靠性和可用性,所以第二章首先介绍了这两者的相关概念,之后结合实际讲了容错机制的分类及其层次分析。第三章针对第二章最后典型容错技术中的纠删码技术进行展开。首先介绍了存储编码的基础知识,在此基础上引出纠删码的概念等知识。随后,介绍了典型的三种编码--RS,BRS和CRS码的原理和编解
特征约简是数据挖掘的一项基础性技术,其目的在于降低数据的维度或提取数据中的重要特征或特征组合。本书系统地阐述了特征变换、特征选择的基本原理、基本过程,介绍了针对连续型、类属型等不同类型数据的过滤型、封装型及嵌入型特征约简方法。着重讨论了近年来兴起的软特征选择技术,以及嵌入自动特征约简的子空间聚类、子空间分类技术,并以实例的方式给出了不同方法在文档挖掘、信息安全以及生物信息学等领域的应用...
《大数据挖掘》一书立足前沿性、注重实用性,着眼于大数据发展的最新研究热点和动向,系统介绍了大数据挖掘的概念、原理、技术和应用,全面而细致地定义和归纳了关联分析、聚类分析、分类分析、异常分析、特异群组挖掘和演变分析等大数据挖掘任务。 本书由上海市数据科学重点实验室朱扬勇教授团队主持著述,该实验室是国内首个致力于数据科学理论、方法和技术研究的机构,专注于金融、智能交通、医疗健康、智慧城市等多领域的大数据分析应用...
本书稿主要包含单论域粗糙集的基本理论、双论域上的粗糙集模型的变换、双论域上基于水平集的粗糙集、双论域上的概率粗糙集、双论域上的多粒度粗糙集、双论域上的多粒度概率粗糙集、双论域上的多粒度决策粗糙集等理论...
本书重点介绍了基础设施运维概念以及如何进行规范操作,实用性高,可操作性强。主要内容如下。第1章总则部分,定义了规程中用到的术语、编写原则、适用范围。第2章对数据中心运维组织、人员、基本制度、运维流程进行了描述。第3~9章重点描述了高低压变配电系统、发电机组、UPS、直流系统、蓄电池组、冷水型制冷系统、直接膨胀式空调、新风自然冷系统、普通空调、制冷自控系统BA、动力环境监控系统、防雷接地系统、综合布线、安防系统和消防系统的维护技术和维护
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你完全没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。
本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、H
适读人群 :想全面学习wireshark的初学者、网络管理员、渗透测试人员、网络安全专家、网络数据分析人士 通过80个实例,详细讲解了wireshark数据包分析实施的8大类技巧 基于wireshark抓取的数据包,层层剥茧地剖析了12种常见网络协议的构成 全面涵盖wireshark基础知识和应用技巧,以及使用wireshark对网络协议进行分析 遵循规范,从专业的角度循序渐进地讲解了wireshark抓包及分析的实施流程 针对海量数
《生态学数据分析:方法、程序与软件》的特点是操作性强,为生态学、植物学、动物学专业的研究生和科技工作者提供了实用的工具书...
《基于数据挖掘的国际科技合作资源监测方法、技术及应用》可供相关专业师生阅读,也可供科技管理人员使用...
如果你准备深入研究MapReduce框架来处理大数据集,这本书非常实用,通过提供丰富的算法和工具,它会循序渐进地带你探索MapReduce世界,用Apache Hadoop或Apache Spark构建分布式MapReduce应用时通常都需要用到这些算法和工具。每一章分别提供一个实例来解决一个大规模计算问题,如构建推荐系统。你会了解如何用代码实现适当的MapReduce解决方案,而且可以在你的项目中具体应用这些解决方案。...
本书深入阐述了图数据管理与挖掘的关键技术和典型应用。内容包括了子图匹配查询处理算法、基于社会网络图数据的推荐方法、时空图挖掘方法、基于专利图数据的专利检索与挖掘方法。同时, 本书也将这些成果分别应用于图数据查询处理系统、社会网络平台、时空数据挖掘系统以及...
冬瓜哥对技术的追求已经到了痴迷的境界,与10年前相比,文笔解析更为到位,技术理解更为精准。其公众号的每篇文章,都是存储业界风向标。...
本书从大数据发展现状出发, 在人类DIKW知识层次中认识“数据”, 阐述大数据时代以数据为中心的必然性, 进而提出数据管理的新范式, 即以系统科学及开放复杂巨系统为主要特征的范式, 并论述数据管理正在向新范式转换 ; 为解决数据系统中众多管理问题, 从数据语义出发给出数据分布模型概念, 并论述其是大数据时代数据管理的核心与基础 ; 定义了一种数据分布模型 —— MHM...
本书介绍了大数据分析的多种模型、所涉及的算法和技术、实现大数据分析系统所需的工具以及大数据分析的具体应用。本书共16章。第1章为绪论,就大数据、大数据分析等概念进行了阐释,并对本书内容进行了概述;第2~7章介绍了关联分析模型、分类分析模型、聚类分析模型、结构分析模型和文本分析模型;第8章介绍大数据分析的数据预处理问题;第9章介绍降维方法;第10章介绍了数据仓库的概念、内涵、组成、体系结构和建立方法,还介绍了分布式数据仓库系统和内存数据
《数据挖掘在Web资源开发与利用中的应用研究》为国家社科基金后期资助项目成果,针对Web资源开发利用面临的主要问题,围绕数据挖掘优化方法,对用户行为分析、个性化推荐、Web信息检索以及Web页面链接分析等方面的内容展开研究。该成果定性与定量研究、理论与实证研究相结合,融合多个学科的技术成果,在研究方法和手段上有所创新。该成果既有翔实的理论阐述,又有系列的公式演示,严谨可信,具有较高的理论研究价值;同时该成果提出的一些新型模型和理论框架
本书结合理论和实践,由浅入深,全方位介绍了Hadoop 这一高性能的海量数据处理和分析平台。全书5部分24 章,第Ⅰ部分介绍Hadoop 基础知识,第Ⅱ部分介绍MapReduce,第Ⅲ部分介绍Hadoop 的运维,第Ⅳ部分介绍Hadoop 相关开源项目,第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapR
本书对经典物理学各个领域的齐次和非齐次波动方程的解的数学结构进行了深刻的揭示,理论成果对工程技术若干领域有用。本书对若干领域用数学特别是场论的方法进行一些探索,初步形成一家之说。本书采用现象学的基本观点和方法,道说追求真理的乐趣、途径和过程;展示作者方法的直观、必然和优雅。本书可供电磁理论、应用数学、线性声学、固体力学、地球物理、应用物理、微波遥感、材料科学、光电子学等专业的科技人员、研究生、大学生阅读和参考,也可作为相应专业研究生有
本书共14章,分三个部分:基础篇、实战篇、高级篇。基础篇介绍了数据挖掘、Hadoop大数据的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析经验,同时快速领悟看似难懂的大数据分析与挖掘理论知识。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助TipDM-HB大数据挖掘建模平台,通过上机实验,以快速理解相关知识与理论...
本书共11章。第1章介绍常见的流数据的来源、应用以及三个重要特性:持续交付、结构松散和高基数,并阐释对流数据使用基础架构和算法的重要性。第2~6章介绍实时流架构的各组件涉及的软件、框架和方法。第2章概述实时流架构设计涉及的组件、特性、编程语言等。第3章介绍实时流架构的服务配置和协调,重点介绍协调服务器ZooKeeper。第4章阐述实时流架构中数据流程的管理,涉及用来管理数据流程的两个软件包Kafka和Flume。第5章分析流数据的处理
本书适合人群: 本书是一本面向商业数据分析初学者的教材,从具体的商业数据分析案例入手,使读者掌握数据挖掘的目的、理念、思路与分析步骤。本书力图淡化技术,对于方法的介绍也尽量避免涉及过多的数学内容,和高等数学相关的内容只在线形回归和主成分分析这两节中涉及,而且都辅以图形做形象的展现。因此本书的读者只需要具有高中水平的数学基础即可。但是本书强调每种方法的假设、适用条件都与商业数据分析的主题匹配。在教学实践中,我们发现业务经验丰富和有较好商
随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了大数据(Big Data)的概念,并声称人类已经脱离了信息时代(Information Time,IT),进入了大数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业
图文详解Kafka的内部原理、设计与实现 全面分析以Kafka为中心的分布式流平台 Kafka新特性详解,包括连接器、流处理...
本书提供了大数据和分析技术应用于石油和天然气行业的完整视图。这本书包含多个实例研究, 强调了在石油和天然气勘探和生产阶段对优化的迫切需求, 并展示了数据分析如何提供这种优化, 涉及石油和天然气的勘探、开发、生产和油气资产的复兴, 可有效地推动石油和天然气的勘探和生产...
r是一种用于统计计算与做图的开源软件,同时也是一种编程语言,它广泛应用于企业和学术界的数据分析领域,正在成为最通用的语言之一。由于近几年数据挖掘、大数据等概念的走红,r也越来越多地被人关注。截至本文完成之日,cran(http://cran.r-project.org/)上共有4383个包,涉及统计、化学、经济、生物、医学、心理、社会学等各个学科。不同类型的公司,比如google、辉瑞、默克、美国银行、洲际酒店集团和壳牌公司都在
本书从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、高级MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;最后,为了提高读者的算法设计与编程实战能力,
当数据存储在多个数据库中,如何查询数据?特别是当这些数据库是由不同的人分别设计。这是第一个全面介绍数据集成的书,由业界三个最受人尊敬的专家撰写。这本书讲解数据集成技术的理论知识,使用大量实例来解释基本概念。数据集成是解决跨多个数据源(如数据库,网页)的问题。目前在多种环境中都涉及数据集成问题,包括企业信息集成,在网络上的查询处理,政府机构之间的协调和科学家之间的合作。在某些情况下,数据集成是某个领域取得进展的关键。本书提供了数据集成的
本书共16章,共三篇。基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具MATALB进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过
本书完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了olap和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研
本书使用一套金融数据以及Elasticsearch搜索技术和聚合框架,用来进行数据分析,是一本技术全面、案例丰富、注重实操的入门书。书中不仅细致地讲解Elasticsearch基础知识和核心接口,还进一步讲述数据建模和实际应用,例如金融舆情分析及机器学习等技术应用。最后逐步详细讲解了如何以编程方式构建RESTful服务接口,实践所学技术。由于书中有很多金融数据分析例子,读者也可了解相应应用场景以及学会其解决方案。书中示例采用一套开源
《Text data mining》 offers thorough and detailed introduction to the fundamental theories and methods of text data mining, ranging from pre-processing (for both Chinese and English texts), text representation, feature se
《Power BI 商业数据分析完全自学教程》是一本系统地讲解利用 Power BI 软件进行商业数据智能分析的自学宝典。本书以“完全精通 Power BI”为出发点,以“用好 Power BI”为目标来安排内容,全书共 5 篇,分为 14 章,循序渐进地介绍了 Power BI 的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。 第 1 篇为基础入门篇(第 1 章 ~ 第 3 章),主要针对初学者,从零
内容简介本书是Python数据分析与挖掘领域的认可的事实标准,第1版销售超过10万册,销售势头依然强劲,被国内100余所高等院校采用为教材,同时也被广大数据科学工作者奉为经典。作者在大数据挖掘与分析等领域有10余年的工程实践、教学和创办企业的经验,不仅掌握行业的近期新技术和实践方法,而且洞悉学生和老师的需求与痛点,这为本书的内容和形式提供了强有力的保障,这是本书第1版能大获成功的关键因素。全书共13章,分为三个部分,从技术理论、工程实
本书针对MongoDB3做了精细更新,呈现MongoDB的所有新特性,涵盖2.2版引入的聚集框架、2.4版引入的哈希索引以及3.2版本的WiredTiger,还新纳入Node.js和Python。 MongoDB是非常流行的“大数据”NoSQL数据库技术,目前仍在蓬勃发展。来自10gen的DavidHows以及经验丰富的PeterMembrey和EelcoPlugge等MongoDB专家联袂撰写本书,在书中分享他们的宝贵专业知识
本书从模型理论和分析应用的角度介绍了科技大数据相关的基础表示模型与数据挖掘算法。具体包括科技大数据的表示模型与学习算法;科技大数据知识图谱的概念和构建技术;科技大数据的图挖掘,跨域迁移学习技术;科技大数据的语义关联与预测分析技术。本书在重点介绍科技大数据相关概念与模型的基础理论的同时,系统讲解了科技大数据知识图谱的概念与构建技术,以及当前科技大数据建模、分析与预测技术的近期新进展...
针对我国设备大数据相关研究刚刚起步的现状,本书以设备健康管理为落脚点,从方法创新和探索应用两个方面对数据采集、存储以及处理分析进行了系统性介绍和阐释。本书介绍了传感器、PLC、工业网关等数据采集中比较重要的几个部分,以及多种不同类型设备大数据的存储方式。本书从模式识别、降维处理及分类与聚类三个方面介绍了设备大数据的分析方法,并利用实际工业过程中的四个案例讲解了大数据为设备状态分析带来的新方法,力图给设备健康领域的技术工程师、科研人员,
本著作针对科技服务中分类用户的个性化需求,实现面向分类用户的个性化需求分析的科技大数据精准服务。主要内容包括分类用户的立体精准画像技术,多维多尺度精准的产学研分类用户画像和精准分类;科技大数据结构化信息的统一建模和精准推荐;基于知识图谱和用户立体精准画像的跨媒体科技资源快速搜索模式;知识图谱驱动的科技大数据协同创新服务机制;开放协同的科技大数据服务平台。本著作将介绍在知识图谱驱动的高可信用户画像、精准推荐与搜索服务,以及科技资源与服务
网络科学是一门正在兴起的交叉性学科,与社会学、贸易物流、管理学等都密切相关。《网络科学与网络大数据结构挖掘》致力于系统地介绍网络科学的基本概念、思想和方法,使得具有高等数学基础的读者都能够看懂,并具备把网络科学方法用于实际网络分析的能力。 本书作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几
《Power Query M函数语言:基于Excel和Power BI的数据清理进阶实战》结合大量教学范例和逻辑示意图,深入介绍Microsoft Excel和Power BI中Power Query M函数语言数据清理技术的运行逻辑和进阶使用技巧。本书按照Power Query M函数语言的知识结构,在《Power Query M函数语言:基于Excel和Power BI的数据清理轻松入门》的基础上,详细、深入地介绍运算符、关键字、
本书共9章。第一章介绍了R语言的基础知识;第二章介绍了基本统计思路和初步数据整理,整理出两个有代表性的指标;第三章涉及数据清理、转换和描述性统计;第四章介绍了数据可视化;第五章介绍了线性混合模型和最大随机效应;第六章涉及结果解释、整理和提升;第七章介绍了power分析和bayes分析在R语言中的实现;第八章比较了线性混合模型和重复测量方差分析结果;第九章整理了多种眼动指标...
1.内容全面。覆盖MATLAB几乎所有常用知识点,满足日常工作需要。2.视频讲解。为了便于读者学习,关键知识点和实例录制视频,并生成二维码,读者用手机扫码看视频。3.实例丰富,并提供源代码,方便读者对照学习。4.提供在线交流,有问题随时交流。 ...
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射
随着计算机和互联网技术的飞速发展和广泛普及, 互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后, 需要通过数据预处理和数据分析来获取数据的价值, 从而造福人类, 推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南, 内容包括三部分: 基础知识、基于Python的大数据预处理、基于Python的大数据分析...
如今,流式数据是大数据中的一个大问题。 随着越来越多的企业试图掌控遍布全球的无限海量数据集,流式系统终于到了足以被主流接纳的成熟度。通过这本实用指南,数据工程师、数据科学家和开发人员将学习到如何以概念化和无关于平台的方式处理流式数据。基于对Tyler Akidau的热门博文《Streaming 101》和《Streaming 102》的拓展,本书将带你从入门到细致入微地理解实时数据流处理的what、where、when和how。你还将
内容简介这是一部面向初级广告优化师、渠道运营人员的广告数据分析和效果优化的实战指南。数据分析功底的深浅,决定了广告优化师能力水平的高低。这本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。全书一共8章:-3章
这是一本 Power BI 的入门指南,涵盖了该工具的基础知识,同时展示了Power BI的主要功能。本书主要包含8章内容,分别为Power BI简介、分享仪表板、理解数据刷新、使用Power BI Desktop、从服务和内容包中获取数据、建立数据模型、改进 Power BI 报告、在公司中应用 Power BI。本书作者拥有多年的教学经验,通过一个打造预算系统的案例,从如何注册账户、导入数据、建立模型、图表动态呈现、报表发布、数据
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下
本书是一本面向Lua程序员和脚本语言爱好者的语言自制指南和实战宝典。作者融合自己丰富的工程实践经验,详细阐述Lua语言的核心语法和实现原理,深入探讨Lua虚拟机、编译器和标准库,并给出了实际可以编译执行的代码。助你从零基础开始编程实现Lua语言,有效理解脚本语言工作原理。全书分为3个部分,共21章。靠前部分主要讨论LuaAPI和虚拟机实现,包括二进制chunk格式、Lua虚拟机指令集、元编程、错误处理等。第二部分主要讨论Lua语法和编
本书内容详实而富有实际指导价值, 通过本书, 软件开发者和架构师将学到如何将这些原则用于实践, 如何在最新应用架构中充分发挥数据的威力。内容包括: 数据系统基础 ; 分布式数据系统 ; 派生数据...
老王子
[英]蕾秋·乔伊斯 著,焦晓菊 译
[日]熊田千佳慕 著,张勇 译
刘争争
汪曾祺
林奕含
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071