扫一扫
关注中图网
官方微博
本类五星书更多>
-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
C Primer Plus 第6版 中文版
-
>
深度学习
-
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码
高性能数据挖掘(快速项集挖掘算法及性能研究) 版权信息
- ISBN:9787517066910
- 条形码:9787517066910 ; 978-7-5170-6691-0
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
高性能数据挖掘(快速项集挖掘算法及性能研究) 内容简介
《高性能数据挖掘:快速项集挖掘算法及性能研究》主要探讨数据挖掘中的项集挖掘问题,详细介绍了频繁项集、高可用项集、频繁项集、频繁闭项集的定义、挖掘算法、搜索空间剪枝技术、性能优化等方面的内容。《高性能数据挖掘:快速项集挖掘算法及性能研究》的重点在于介绍如何提高挖掘速度、提升挖掘时的内存使用效率;《高性能数据挖掘:快速项集挖掘算法及性能研究》的特色在于不仅对这些挖掘方法与技术在理论上进行描述,同时作者执行了严格的实验用以佐证结论。 《高性能数据挖掘:快速项集挖掘算法及性能研究》可作为高年级本科生、数据挖掘方向的研究生、有兴趣青年学者的参考书。
高性能数据挖掘(快速项集挖掘算法及性能研究) 目录
前言
第1章 概述
1.1 项集:数据挖掘研究领域的焦点之一
1.2 频繁项集挖掘问题的研究历史
1.3 高可用项集挖掘问题的研究历史
1.4 本书的主要内容
第2章 频繁项集挖掘问题
2.1 概述
2.1.1 问题形式化定义
2.1.2 搜索空间与方法
2.2 基础频繁项集挖掘算法介绍
2.2.1 经典的候选生成Apriori算法
2.2.2 以垂直视角处理数据库的Eclat算法
2.2.3 基于前缀树结构的FP-growth算法
2.3 性能测试的软硬件环境
2.3.1 数据库描述
2.3.2 参照算法介绍
2.3.3 其他软硬件设施
2.4 实验一:三种基础算法的性能测试
2.4.1 实验结果
2.4.2 性能评价
第3章 BFP-growth:快速模式增长算法
3.1 经典模式增长算法的性能分析
3.1.1 影响FP-growth性能的三个因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增长算法:BFP-growth
3.2.1 性能提升的途径
3.2.2 核心步骤:两次前缀树遍历
3.2.3 算法伪代码
3.3 BFP-growth算法的性能分析
3.3.1 更少的遍历花费
3.3.2 FP-array技术应该集成在BFP-growth中吗
3.3.3 无修饰的前缀树结构
3.4 实验二:BFP-growth的性能测试及讨论
3.4.1 BFP-growth及FPgrowth*与基础算法的对比
3.4.2 实验结果讨论
3.5 小结
第4章 基于结点集合结构的NS算法
4.1 Eclat及FP-growth算法的优缺点
4.2 结点集合结构(Node-set)
4.2.1 条件结点
4.2.2 结点拓扑序号
4.2.3 使用结点集合结构表示前缀树
4.3 NS算法
4.3.1 映射前缀树到结点集合结构
4.3.2 从结点集合结构中挖掘频繁项集
4.3.3 一个例子
4.3.4 NS算法的原子操作
4.4 实验三:NS算法与其他快速挖掘算法的性能对比
4.4.1 实验结果
4.4.2 结果讨论:NS算法的性能优势
4.5 小结
第5章 用Patricia*结构挖掘频繁项集
5.1 研究动机
5.2 Patricia*结构
5.2.1 单孩子结点
5.2.2 构造:Patricia*结构
5.3 用Patricia*结构挖掘频繁项集
5.3.1 先前的挖掘流程
5.3.2 改进的挖掘流程
5.3.3 PatriciaMine*算法
5.4 实验结果
5.4.1 结点数量统计
5.4.2 性能对比
5.5 小结
第6章 频繁项集挖掘算法的内存耗费
6.1 BFP-growth算法内存使用情况分析
6.2 NS算法内存使用情况分析
6.3 实验四:快速挖掘算法的内存耗费
6.4 SP算法
6.4.1 研究动机
6.4.2 基础知识
6.4.3 挖掘频繁项集
6.4.4 实验结果与结论
第7章 高可用项集挖掘问题
7.1 从频繁项集到高可用项集
7.2 问题的形式化定义
7.3 已有挖掘算法概述
第8章 非候选生成高可用项集挖掘算法
8.1 项集有用性列表结构
8.1.1 初始有用性列表
8.1.2 2-项集的有用性列表
8.1.3 缸项集有用性列表(k≥3)
8.2 HUI-Miner算法
8.2.1 剪枝策略
8.2.2 算法伪代码
8.3 HUI-Miner算法的实现细节
8.3.1 有用性列表表头
8.3.2 重新标注tid
8.3.3 交易权重有用性增加的顺序
8.4 实验五:HUI-Miner性能测试
8.4.1 实验设置
8.4.2 HUI-Miner及对比算法的运行时间
8.4.3 HUI-Miner及对比算法的内存耗费
8.4.4 项处理顺序对HUI-Miner性能的影响
8.4.5 可扩展性
8.4.6 实验结果讨论
8.5 小结
第9章 快速识别高可用项集
9.1 先前算法的性能瓶颈
9.2 基本识别算法(BIA)
9.3 基于候选树的快速识别算法(FIA)
9.3.1 候选树结构
9.3.2 快速识别算法
9.4 算法分析:BIA与FIA
9.5 实验六:BIA与FIA的性能对比
9.5.1 高可用项集识别时间
9.5.2 候选项集生成时间
9.5.3 内存耗费
9.5.4 实验结果分析
9.6 实验七:FIA-UP-Growth+和HUI-Miner的性能对比
9.6.1 运行时间&内存耗费
9.6.2 实验结果分析
9.7 小结
第10章 *大频繁项集挖掘
10.1 介绍
10.2 基本概念
10.3 MAFIA算法
10.3.1 深度优先遍历
10.3.2 搜索空间剪枝
10.3.3 有效的MFI超集检查
10.4 挖掘非*大频繁项集
10.4.1 挖掘所有的频繁项集
10.4.2 挖掘所有的频繁闭项集
10.5 实施细节
10.6 结论
第11章 频繁闭项集挖掘
11.1 介绍
11.2 频繁项集挖掘
11.2.1 基本定义
11.2.2 先前的解决方案
11.3 项集-记录标识符集合搜索树与等价类
11.4 CHARM算法设计与实现
11.4.1 快速的闭项集子集合检查
11.4.2 使用差异集合快速进行频繁计数
11.4.3 其他优化及正确性
11.5 实验结果
11.6 结论
参考文献
第1章 概述
1.1 项集:数据挖掘研究领域的焦点之一
1.2 频繁项集挖掘问题的研究历史
1.3 高可用项集挖掘问题的研究历史
1.4 本书的主要内容
第2章 频繁项集挖掘问题
2.1 概述
2.1.1 问题形式化定义
2.1.2 搜索空间与方法
2.2 基础频繁项集挖掘算法介绍
2.2.1 经典的候选生成Apriori算法
2.2.2 以垂直视角处理数据库的Eclat算法
2.2.3 基于前缀树结构的FP-growth算法
2.3 性能测试的软硬件环境
2.3.1 数据库描述
2.3.2 参照算法介绍
2.3.3 其他软硬件设施
2.4 实验一:三种基础算法的性能测试
2.4.1 实验结果
2.4.2 性能评价
第3章 BFP-growth:快速模式增长算法
3.1 经典模式增长算法的性能分析
3.1.1 影响FP-growth性能的三个因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增长算法:BFP-growth
3.2.1 性能提升的途径
3.2.2 核心步骤:两次前缀树遍历
3.2.3 算法伪代码
3.3 BFP-growth算法的性能分析
3.3.1 更少的遍历花费
3.3.2 FP-array技术应该集成在BFP-growth中吗
3.3.3 无修饰的前缀树结构
3.4 实验二:BFP-growth的性能测试及讨论
3.4.1 BFP-growth及FPgrowth*与基础算法的对比
3.4.2 实验结果讨论
3.5 小结
第4章 基于结点集合结构的NS算法
4.1 Eclat及FP-growth算法的优缺点
4.2 结点集合结构(Node-set)
4.2.1 条件结点
4.2.2 结点拓扑序号
4.2.3 使用结点集合结构表示前缀树
4.3 NS算法
4.3.1 映射前缀树到结点集合结构
4.3.2 从结点集合结构中挖掘频繁项集
4.3.3 一个例子
4.3.4 NS算法的原子操作
4.4 实验三:NS算法与其他快速挖掘算法的性能对比
4.4.1 实验结果
4.4.2 结果讨论:NS算法的性能优势
4.5 小结
第5章 用Patricia*结构挖掘频繁项集
5.1 研究动机
5.2 Patricia*结构
5.2.1 单孩子结点
5.2.2 构造:Patricia*结构
5.3 用Patricia*结构挖掘频繁项集
5.3.1 先前的挖掘流程
5.3.2 改进的挖掘流程
5.3.3 PatriciaMine*算法
5.4 实验结果
5.4.1 结点数量统计
5.4.2 性能对比
5.5 小结
第6章 频繁项集挖掘算法的内存耗费
6.1 BFP-growth算法内存使用情况分析
6.2 NS算法内存使用情况分析
6.3 实验四:快速挖掘算法的内存耗费
6.4 SP算法
6.4.1 研究动机
6.4.2 基础知识
6.4.3 挖掘频繁项集
6.4.4 实验结果与结论
第7章 高可用项集挖掘问题
7.1 从频繁项集到高可用项集
7.2 问题的形式化定义
7.3 已有挖掘算法概述
第8章 非候选生成高可用项集挖掘算法
8.1 项集有用性列表结构
8.1.1 初始有用性列表
8.1.2 2-项集的有用性列表
8.1.3 缸项集有用性列表(k≥3)
8.2 HUI-Miner算法
8.2.1 剪枝策略
8.2.2 算法伪代码
8.3 HUI-Miner算法的实现细节
8.3.1 有用性列表表头
8.3.2 重新标注tid
8.3.3 交易权重有用性增加的顺序
8.4 实验五:HUI-Miner性能测试
8.4.1 实验设置
8.4.2 HUI-Miner及对比算法的运行时间
8.4.3 HUI-Miner及对比算法的内存耗费
8.4.4 项处理顺序对HUI-Miner性能的影响
8.4.5 可扩展性
8.4.6 实验结果讨论
8.5 小结
第9章 快速识别高可用项集
9.1 先前算法的性能瓶颈
9.2 基本识别算法(BIA)
9.3 基于候选树的快速识别算法(FIA)
9.3.1 候选树结构
9.3.2 快速识别算法
9.4 算法分析:BIA与FIA
9.5 实验六:BIA与FIA的性能对比
9.5.1 高可用项集识别时间
9.5.2 候选项集生成时间
9.5.3 内存耗费
9.5.4 实验结果分析
9.6 实验七:FIA-UP-Growth+和HUI-Miner的性能对比
9.6.1 运行时间&内存耗费
9.6.2 实验结果分析
9.7 小结
第10章 *大频繁项集挖掘
10.1 介绍
10.2 基本概念
10.3 MAFIA算法
10.3.1 深度优先遍历
10.3.2 搜索空间剪枝
10.3.3 有效的MFI超集检查
10.4 挖掘非*大频繁项集
10.4.1 挖掘所有的频繁项集
10.4.2 挖掘所有的频繁闭项集
10.5 实施细节
10.6 结论
第11章 频繁闭项集挖掘
11.1 介绍
11.2 频繁项集挖掘
11.2.1 基本定义
11.2.2 先前的解决方案
11.3 项集-记录标识符集合搜索树与等价类
11.4 CHARM算法设计与实现
11.4.1 快速的闭项集子集合检查
11.4.2 使用差异集合快速进行频繁计数
11.4.3 其他优化及正确性
11.5 实验结果
11.6 结论
参考文献
展开全部
书友推荐
- >
唐代进士录
唐代进士录
¥18.7¥39.8 - >
有舍有得是人生
有舍有得是人生
¥21.2¥45.0 - >
月亮与六便士
月亮与六便士
¥13.4¥42.0 - >
随园食单
随园食单
¥26.9¥48.0 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0 - >
名家带你读鲁迅:朝花夕拾
名家带你读鲁迅:朝花夕拾
¥10.5¥21.0 - >
山海经
山海经
¥20.4¥68.0 - >
【精装绘本】画给孩子的中国神话
【精装绘本】画给孩子的中国神话
¥17.6¥55.0
本类畅销
-
数学之美
¥48.3¥69 -
浪潮之巅-下册-第二版
¥22.1¥45 -
挑战程序设计竞赛(第2版)
¥55.3¥79 -
算法竞赛入门经典-(第2版)
¥34.9¥49.8 -
2022图书×抽奖盲袋
¥9.9¥25 -
2023读书月阅读盲盒——天黑,闭眼,刀谁?
¥42.3¥158