读书月福利
欢迎光临中图网 请 | 注册
> >>
Web知识挖掘-理论.方法与应用

Web知识挖掘-理论.方法与应用

作者:郑庆华
出版社:科学出版社出版时间:2010-06-01
开本: 16开 页数: 336
中 图 价:¥26.0(5.2折) 定价  ¥50.0 登录后可看到会员价
暂时缺货 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
本类五星书更多>

Web知识挖掘-理论.方法与应用 版权信息

Web知识挖掘-理论.方法与应用 本书特色

《Web知识挖掘:理论、方法与应用》由科学出版社出版。

Web知识挖掘-理论.方法与应用 内容简介

本书是一部关于web知识挖掘的比较系统、完整,且理论和实践相结合的著作,共含7章:第1章与第2章是web知识挖掘概论,其中,第1章总体上对web知识挖掘的现状、概念、典型方法、应用领域以及面临的挑战进行综述性说明;第2章介绍了web知识挖掘的预备知识、分类体系、基本流程等内容。第3~6章是web知识挖掘的理论与方法,分别论述了web爬取、web结构挖掘、内容挖掘、日志挖掘相关理论与方法,并系统总结了我们自己在元数据、概念、知识元等多个层次上的知识获取以及个性化知识服务等方面的工作。第7章是web知识挖掘的实践与应用实例,以实例对web结构挖掘、日志挖掘及内容挖掘的应用进行了说明。
本书不仅系统地介绍了web知识挖掘领域的基础理论与方法,也阐述了我们在该领域的创新性工作,因而适合不同类型与层次的研究人员及学生。
本书可作为信息领域的科研与工程技术人员的参考书,也可作为计算机与相关专业的研究生和高年级本科生的教材或辅导书目。

Web知识挖掘-理论.方法与应用 目录

前言
第1章 web挖掘概述
1.1 web发展历史与现状
1.2 web挖掘的概念
1.3 web挖掘面临的挑战
1.4 web挖掘的研究方向
1.5 小结
第2章 web挖掘的基础知识
2.1 web挖掘的主要预备知识
2.2 web挖掘分类
2.3 web挖掘的主要应用
2.4 web挖掘的基本流程
2.5 web挖掘领域的重要文献、国际期刊与会议、标准规范
2.6 小结
第3章 web爬取与页面组织管理
3.1 web爬取概述
3.2 web爬取中的主要技术问题
3.3 隐含web爬取
3.4 面向主题的web爬取
3.5 爬取页面的存储与管理
3.6 小结
第4章 web结构挖掘
4.1 web结构挖掘概述
4.2 pagerank算法
4.3 hits算法
4.4 hilltop算法
4.5 web宏观结构特性分析
4.6 小结
第5章 web内容挖掘
5.1 web页面的特征表示
5.2 web页面分类
5.3 web页面聚类
5.4 面向web的信息抽取
5.5 面向web的本体学习
5.6 面向web的知识元及其关联抽取
5.7 多媒体数据挖掘
5.8 web内容挖掘的未来研究方向
5.9 小结
第6章 web日志挖掘
6.1 web日志挖掘概述
6.2 web日志预处理
6.3 序列模式挖掘
6.4 web用户行为模式挖掘
6.5 web用户个性挖掘
6.6 web用户兴趣感知
6.7 web日志挖掘的未来研究方向
6.8 小结
第7章 web挖掘的应用实例
7.1 应用1:面向网络学习的学习者个性挖掘
7.2 应用2:海量web资源中的知识处理与服务
7.3 小结
参考文献
展开全部

Web知识挖掘-理论.方法与应用 节选

《Web知识挖掘:理论、方法与应用》是一部关于Web知识挖掘的比较系统、完整,且理论和实践相结合的著作,共含7章:第1章与第2章是Web知识挖掘概论,其中,第1章总体上对Web知识挖掘的现状、概念、典型方法、应用领域以及面临的挑战进行综述性说明;第2章介绍了Web知识挖掘的预备知识、分类体系、基本流程等内容。第3~6章是Web知识挖掘的理论与方法,分别论述了Web爬取、Web结构挖掘、内容挖掘、日志挖掘相关理论与方法,并系统总结了我们自己在元数据、概念、知识元等多个层次上的知识获取以及个性化知识服务等方面的工作。第7章是Web知识挖掘的实践与应用实例,以实例对Web结构挖掘、日志挖掘及内容挖掘的应用进行了说明。《Web知识挖掘:理论、方法与应用》不仅系统地介绍了Web知识挖掘领域的基础理论与方法,也阐述了我们在该领域的创新性工作,因而适合不同类型与层次的研究人员及学生。《Web知识挖掘:理论、方法与应用》可作为信息领域的科研与工程技术人员的参考书,也可作为计算机与相关专业的研究生和高年级本科生的教材或辅导书目。

Web知识挖掘-理论.方法与应用 相关资料

插图:Web挖掘是从数据挖掘发展而来的,但与传统的数据挖掘相比有许多独特之处。数据挖掘,又称为面向数据库的知识发现(knowledge discovery in database,KDD),就是从大量数据中获取新颖的、潜在有用的模式的过程。数据挖掘的对象是来自关系型数据库或XML数据库中的结构化数据。而Web挖掘的对象包括网页、图像、声音、视频、网页之间的链接以及网站用户的日志数据。除了日志数据外,其他类型数据具有海量、异构、非结构化等特性,传统的数据挖掘技术还很难处理这类数据。因此,必须在Web挖掘领域中,研究专门针对Web数据特点的算法与方法。在信息检索中,用户以关键词组合表达检索需求,通过关键词匹配的方式从特定文档集中返回与检索需求相关的文档。信息检索包括文档的建模、分类、索引、结果排序与可视化Web等流程,Web挖掘技术一般用于其中的分类、索引以及结果排序,从这个角度来说,Web挖掘是信息检索过程的重要组成部分(Kosala etal,2000)。另一方面,信息检索的结果往往也是Web挖掘的对象,如在HITS算法中,因而信息检索也可作为Web挖掘的组成部分。信息抽取指从给定的文档中抽取特定类别的信息,例如,从一篇文档中抽取标题、作者等元数据信息。由于Web站点的异构性,大多数信息抽取都是对针对特定网站,一些抽取方法能够自动或半自动地建立抽取模式(Kushmerick,1999),对于这类信息抽取,Web挖掘可以看做信息抽取的一个过程。此外,在Web挖掘中,利用信息抽取可以建立文档的压缩版本以提高挖掘效率,从这个角度来说,信息抽取可以作为Web挖掘的预处理过程。

商品评论(0条)
暂无评论……
书友推荐
编辑推荐
返回顶部
中图网
在线客服