-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
C Primer Plus 第6版 中文版
-
>
深度学习
-
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码
驾驭文本-文本的发现.组织和处理 版权信息
- ISBN:9787121252303
- 条形码:9787121252303 ; 978-7-121-25230-3
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
驾驭文本-文本的发现.组织和处理 本书特色
文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。本书的特点在于通过实例来理解文本处理的这些概念和技术,读者利用现有的开源工具就可以自己实现这些实例。
驾驭文本-文本的发现.组织和处理 内容简介
文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。本书的特点在于通过实例来理解文本处理的这些概念和技术,读者利用现有的开源工具就可以自己实现这些实例。
驾驭文本-文本的发现.组织和处理 目录
第1章 开始驾驭文本
1.1 驾驭文本重要的原因
1.2 预览:一个基于事实的问答系统
1.2.1 嗨,弗兰肯斯坦医生
1.3 理解文本很困难
1.4 驾驭的文本
1.5 文本及智能应用:搜索及其他
1.5.1 搜索和匹配
1.5.2 抽取信息
1.5.3 对信息分组
1.5.4 一个智能应用
1.6 小结
1.7 相关资源
第2章 驾驭文本的基础
2.1 语言基础知识
2.1.1 词语及其类别
2.1.2 短语及子句
2.1.3 词法
2.2 文本处理常见工具
2.2.1 字符串处理工具
2.2.2 词条及切词
2.2.3 词性标注
2.2.4 词干还原
2.2.5 句子检测
2.2.6 句法分析和文法
2.2.7 序列建模
2.3 从常见格式文件中抽取内容并做预处理
2.3.1 预处理的重要性
2.3.2 利用apache tika抽取内容
2.4 小结
2.5 相关资源
第3章 搜索
3.1 搜索和多面示例:amazon.com
3.2 搜索概念入门
3.2.1 索引内容
3.2.2 用户输入
3.2.3 利用向量空间模型对文档排名
3.2.4 结果展示
……
第4章 模糊字符串匹配
第5章 命名实体识别
第6章 文本聚类
第7章 分类及标注
第8章 构建示例问答系统
第9章 未驾驭的文本:探索未来前沿
驾驭文本-文本的发现.组织和处理 作者简介
王斌,博士,中国科学院信息工程研究所研究员,博士生导师,研究方向为信息检索与自然语言处理。主持科研项目20余项,发表学术论文120余篇,译有《信息检索导论》、《大数据:互联网大规模数据挖掘与分布式处理》、《机器学习实战》、《Mahout实战》等书籍。现为中国中文信息学会理事、信息检索专委会、社会媒体处理专委会及语言与知识计算专业委员会委员,《中文信息学报》编委,中国计算机学会高级会员及中文信息处理专委会委员。
- >
名家带你读鲁迅:故事新编
名家带你读鲁迅:故事新编
¥13.0¥26.0 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥16.0¥45.8 - >
二体千字文
二体千字文
¥16.0¥40.0 - >
我从未如此眷恋人间
我从未如此眷恋人间
¥16.4¥49.8 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥11.0¥23.0 - >
姑妈的宝刀
姑妈的宝刀
¥11.4¥30.0 - >
伯纳黛特,你要去哪(2021新版)
伯纳黛特,你要去哪(2021新版)
¥15.9¥49.8 - >
史学评论
史学评论
¥13.9¥42.0
-
数学之美
¥48.3¥69 -
浪潮之巅-下册-第二版
¥22.1¥45 -
挑战程序设计竞赛(第2版)
¥55.3¥79 -
算法竞赛入门经典-(第2版)
¥34.9¥49.8 -
2022图书×抽奖盲袋
¥9.9¥25 -
2023读书月阅读盲盒——天黑,闭眼,刀谁?
¥42.3¥158