中图网文创礼盒,买2个减5元
欢迎光临中图网 请 | 注册
> >
高性能数据挖掘(快速项集挖掘算法及性能研究)

高性能数据挖掘(快速项集挖掘算法及性能研究)

作者:屈俊峰 著
出版社:中国水利水电出版社出版时间:2018-08-01
开本: 16开 页数: 161
读者评分:4分1条评论
中 图 价:¥15.4(3.2折) 定价  ¥48.0 登录后可看到会员价
加入购物车 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口
有划线标记、光盘等附件不全详细品相说明>>
本类五星书更多>
微信公众号

高性能数据挖掘(快速项集挖掘算法及性能研究) 版权信息

  • ISBN:9787517066910
  • 条形码:9787517066910 ; 978-7-5170-6691-0
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

高性能数据挖掘(快速项集挖掘算法及性能研究) 内容简介

  《高性能数据挖掘:快速项集挖掘算法及性能研究》主要探讨数据挖掘中的项集挖掘问题,详细介绍了频繁项集、高可用项集、频繁项集、频繁闭项集的定义、挖掘算法、搜索空间剪枝技术、性能优化等方面的内容。《高性能数据挖掘:快速项集挖掘算法及性能研究》的重点在于介绍如何提高挖掘速度、提升挖掘时的内存使用效率;《高性能数据挖掘:快速项集挖掘算法及性能研究》的特色在于不仅对这些挖掘方法与技术在理论上进行描述,同时作者执行了严格的实验用以佐证结论。  《高性能数据挖掘:快速项集挖掘算法及性能研究》可作为高年级本科生、数据挖掘方向的研究生、有兴趣青年学者的参考书。

高性能数据挖掘(快速项集挖掘算法及性能研究) 目录

前言

第1章 概述
1.1 项集:数据挖掘研究领域的焦点之一
1.2 频繁项集挖掘问题的研究历史
1.3 高可用项集挖掘问题的研究历史
1.4 本书的主要内容

第2章 频繁项集挖掘问题
2.1 概述
2.1.1 问题形式化定义
2.1.2 搜索空间与方法
2.2 基础频繁项集挖掘算法介绍
2.2.1 经典的候选生成Apriori算法
2.2.2 以垂直视角处理数据库的Eclat算法
2.2.3 基于前缀树结构的FP-growth算法
2.3 性能测试的软硬件环境
2.3.1 数据库描述
2.3.2 参照算法介绍
2.3.3 其他软硬件设施
2.4 实验一:三种基础算法的性能测试
2.4.1 实验结果
2.4.2 性能评价

第3章 BFP-growth:快速模式增长算法
3.1 经典模式增长算法的性能分析
3.1.1 影响FP-growth性能的三个因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增长算法:BFP-growth
3.2.1 性能提升的途径
3.2.2 核心步骤:两次前缀树遍历
3.2.3 算法伪代码
3.3 BFP-growth算法的性能分析
3.3.1 更少的遍历花费
3.3.2 FP-array技术应该集成在BFP-growth中吗
3.3.3 无修饰的前缀树结构
3.4 实验二:BFP-growth的性能测试及讨论
3.4.1 BFP-growth及FPgrowth*与基础算法的对比
3.4.2 实验结果讨论
3.5 小结

第4章 基于结点集合结构的NS算法
4.1 Eclat及FP-growth算法的优缺点
4.2 结点集合结构(Node-set)
4.2.1 条件结点
4.2.2 结点拓扑序号
4.2.3 使用结点集合结构表示前缀树
4.3 NS算法
4.3.1 映射前缀树到结点集合结构
4.3.2 从结点集合结构中挖掘频繁项集
4.3.3 一个例子
4.3.4 NS算法的原子操作
4.4 实验三:NS算法与其他快速挖掘算法的性能对比
4.4.1 实验结果
4.4.2 结果讨论:NS算法的性能优势
4.5 小结

第5章 用Patricia*结构挖掘频繁项集
5.1 研究动机
5.2 Patricia*结构
5.2.1 单孩子结点
5.2.2 构造:Patricia*结构
5.3 用Patricia*结构挖掘频繁项集
5.3.1 先前的挖掘流程
5.3.2 改进的挖掘流程
5.3.3 PatriciaMine*算法
5.4 实验结果
5.4.1 结点数量统计
5.4.2 性能对比
5.5 小结

第6章 频繁项集挖掘算法的内存耗费
6.1 BFP-growth算法内存使用情况分析
6.2 NS算法内存使用情况分析
6.3 实验四:快速挖掘算法的内存耗费
6.4 SP算法
6.4.1 研究动机
6.4.2 基础知识
6.4.3 挖掘频繁项集
6.4.4 实验结果与结论

第7章 高可用项集挖掘问题
7.1 从频繁项集到高可用项集
7.2 问题的形式化定义
7.3 已有挖掘算法概述

第8章 非候选生成高可用项集挖掘算法
8.1 项集有用性列表结构
8.1.1 初始有用性列表
8.1.2 2-项集的有用性列表
8.1.3 缸项集有用性列表(k≥3)
8.2 HUI-Miner算法
8.2.1 剪枝策略
8.2.2 算法伪代码
8.3 HUI-Miner算法的实现细节
8.3.1 有用性列表表头
8.3.2 重新标注tid
8.3.3 交易权重有用性增加的顺序
8.4 实验五:HUI-Miner性能测试
8.4.1 实验设置
8.4.2 HUI-Miner及对比算法的运行时间
8.4.3 HUI-Miner及对比算法的内存耗费
8.4.4 项处理顺序对HUI-Miner性能的影响
8.4.5 可扩展性
8.4.6 实验结果讨论
8.5 小结

第9章 快速识别高可用项集
9.1 先前算法的性能瓶颈
9.2 基本识别算法(BIA)
9.3 基于候选树的快速识别算法(FIA)
9.3.1 候选树结构
9.3.2 快速识别算法
9.4 算法分析:BIA与FIA
9.5 实验六:BIA与FIA的性能对比
9.5.1 高可用项集识别时间
9.5.2 候选项集生成时间
9.5.3 内存耗费
9.5.4 实验结果分析
9.6 实验七:FIA-UP-Growth+和HUI-Miner的性能对比
9.6.1 运行时间&内存耗费
9.6.2 实验结果分析
9.7 小结

第10章 *大频繁项集挖掘
10.1 介绍
10.2 基本概念
10.3 MAFIA算法
10.3.1 深度优先遍历
10.3.2 搜索空间剪枝
10.3.3 有效的MFI超集检查
10.4 挖掘非*大频繁项集
10.4.1 挖掘所有的频繁项集
10.4.2 挖掘所有的频繁闭项集
10.5 实施细节
10.6 结论

第11章 频繁闭项集挖掘
11.1 介绍
11.2 频繁项集挖掘
11.2.1 基本定义
11.2.2 先前的解决方案
11.3 项集-记录标识符集合搜索树与等价类
11.4 CHARM算法设计与实现
11.4.1 快速的闭项集子集合检查
11.4.2 使用差异集合快速进行频繁计数
11.4.3 其他优化及正确性
11.5 实验结果
11.6 结论
参考文献
展开全部
商品评论(1条)
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服