图书介绍
中文信息抽取原理与应用【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

- 程显毅,朱倩,王进编著 著
- 出版社: 北京:科学出版社
- ISBN:9787030266231
- 出版时间:2010
- 标注页数:304页
- 文件大小:22MB
- 文件页数:317页
- 主题词:汉语-文字处理系统-研究
PDF下载
下载说明
中文信息抽取原理与应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
原理篇3
第1章 绪论3
1.1 信息抽取产生的背景3
1.2 信息抽取概念4
1.3 信息抽取任务5
1.4 信息抽取和相关概念之间的关系6
1.5 信息抽取的意义10
1.6 信息抽取的研究现状12
1.6.1 国外研究现状12
1.6.2 国内研究现状14
1.7 存在的问题及解决策略15
1.8 信息抽取的挑战和趋势16
第2章 信息抽取评估19
2.1 信息抽取评估一般原则19
2.2 国际测评会议20
2.2.1 MUC测评会议21
2.2.2 ACE测评会议21
2.2.3 MET测评会议26
2.2.4 DUC测评会议27
第3章 信息抽取原理28
3.1 信息抽取系统体系结构28
3.2 信息抽取方法分类30
3.3 文本表示31
3.3.1 向量空间模型31
3.3.2 N-gram模型33
3.3.3 类短语串模型33
3.3.4 概念模型37
3.3.5 事件模型39
3.3.6 图模型40
3.4 词法分析41
3.4.1 自动分词41
3.4.2 词性标注44
3.5 语义标注及其角色45
3.5.1 语义标注45
3.5.2 语义角色精细等级47
3.5.3 框架网及其语义角色49
3.5.4 命题库及其语义角色52
3.5.5 中文网库及其语义角色56
3.5.6 问句问点的语义角色60
3.5.7 语义标注方法及步骤61
3.6 语料库建设62
3.6.1 语料库在信息抽取研究中的地位63
3.6.2 大型现代汉语语料库简介64
3.6.3 语料库系统66
3.6.4 语料库标注70
第4章 基于NLP的信息抽取71
4.1 经典系统71
4.2 相关技术72
第5章 基于规则的信息抽取77
5.1 原理77
5.2 规则的建立80
5.3 规则抽取系统84
5.4 自由文本规则抽取系统讨论89
5.5 规则抽取系统比较91
5.6 规则抽取的困难92
第6章 基于统计模型的信息抽取94
6.1 原理94
6.2 N元模型94
6.2.1 基本思想94
6.2.2 数据平滑方法95
6.3 基于隐马尔可夫模型的信息抽取96
6.3.1 马尔可夫模型96
6.3.2 隐马尔可夫模型97
6.3.3 隐马尔可夫模型的三个基本问题98
6.3.4 基于隐马尔可夫模型的信息抽取102
6.4 最大熵模型104
6.4.1 形式化描述104
6.4.2 模型求解105
6.5 条件随机场模型106
6.5.1 形式化描述106
6.5.2 参数估计107
6.5.3 特征选择108
6.6 支持向量机模型109
6.6.1 线性SVM110
6.6.2 线性SVM构造111
6.6.3 非线性SVM112
6.6.4 非线性SVM构造113
6.6.5 SVM学习算法113
6.7 统计模型的局限性114
第7章 基于认知模型的信息抽取116
7.1 原理116
7.2 基于本体的信息抽取116
7.2.1 本体的概念116
7.2.2 本体建模117
7.2.3 本体描述119
7.2.4 基于本体的信息抽取逻辑结构121
7.2.5 应用实例123
7.3 基于知网的信息抽取126
7.3.1 引言126
7.3.2 义原128
7.3.3 概念表示130
7.3.4 基于知网的中文信息结构抽取研究132
7.4 基于HNC理论的信息抽取135
7.4.1 HNC理论的研究目标和研究内容135
7.4.2 HNC理论的语言概念空间138
7.4.3 HNC理论的概念表述模式141
7.4.4 HNC理论的语句表述模式143
7.4.5 语句相似度计算145
7.4.6 基于NC的语境框架抽取146
7.5 基于混合模型的信息抽取150
第8章 中文命名实体识别151
8.1 命名实体151
8.2 中文人名识别152
8.2.1 中文姓名用字特点152
8.2.2 中文姓名前后文规律153
8.2.3 基于规则的识别模型153
8.2.4 基于统计的识别模型154
8.3 中文地名识别157
8.3.1 地名识别知识库的建造157
8.3.2 地名识别规则库建造162
8.3.3 地名识别推理机制163
8.3.4 地名自动识别系统的实现164
8.3.5 示例和实验结果168
8.4 中文机构名识别169
8.4.1 机构名特点169
8.4.2 模型概述170
8.4.3 标注体系171
8.4.4 后界判断172
8.4.5 前部标注175
8.4.6 机构名识别过程180
8.5 数量结构识别181
8.5.1 数量结构的类型及自动识别的意义181
8.5.2 程序的算法设计及总流程182
第9章 共指消解185
9.1 指代的解析185
9.2 歧义问题186
9.3 测评标准187
9.4 相关技术188
9.4.1 国外的相关技术188
9.4.2 国内的相关技术191
9.5 中文的共指消解193
第10章 信息抽取模板195
10.1 模板的定义和结构195
10.2 信息结构抽取195
10.3 事件探测196
10.4 模板生成196
10.4.1 模板元素(TE)的构建197
10.4.2 模板关系(TR)的构建198
10.4.3 场景模板(ST)的产生200
10.5 模板填充201
第11章 Web信息抽取203
11.1 概述203
11.2 语义Web203
11.2.1 基本概念203
11.2.2 本体描述语言205
11.3 格式转换206
11.4 信息解析206
11.5 基于DOM子树的抽取规则抽取算法207
11.5.1 DOM207
11.5.2 XPath208
11.5.3 XSLT210
11.5.4 NE-DOM分析210
11.5.5 基于DOM子树的抽取规则抽取算法212
应用篇219
第12章 信息抽取工具GATE219
12.1 概述219
12.1.1 GATE的组件219
12.1.2 GATE的作用221
12.1.3 GATE的应用221
12.1.4 GATE系统的整体架构225
12.2 英文信息抽取226
12.2.1 信息抽取插件ANNIE226
12.2.2 抽取规则插件JAPE226
12.2.3 GATE中的标注集的数据结构分析228
12.2.4 批量的英文信息抽取229
12.3 中文信息抽取230
12.3.1 中文信息抽取的困难230
12.3.2 基于GATE的中文信息抽取系统的解决思路231
12.4 GATE组件扩展233
第13章 信息抽取工具WHISK235
13.1 WHISK的规则表示235
13.1.1 结构化和半结构化文本的规则235
13.1.2 语法文本的扩展规则236
13.2 WHISK算法238
13.2.1 人工标记训练样本238
13.2.2 从种子例子中创建一条规则239
13.2.3 槽的抽取240
13.2.4 增加术语到建议的规则上242
13.2.5 爬山和地平线效应243
13.2.6 预删除和后删除的规则243
13.3 训练集合构造244
13.3.1 选择样本244
13.3.2 何时停止标注245
13.4 实验分析245
13.4.1 问题描述245
13.4.2 方法和指标247
13.4.3 实验及分析247
13.5 关于WIHSK的讨论252
第14章 IE在自然语言查询接口中的应用254
14.1 自然语言查询接口的背景254
14.2 自然语言查询接口的逻辑结构254
14.3 信息抽取模型257
14.4 信息抽取算法258
第15章 IE在国民经济中的应用260
15.1 面向电子交易的信息抽取模型260
15.1.1 总体框架260
15.1.2 基于DOM树的抽取规则262
15.2 城市道路交通的信息抽取265
15.2.1 城市道路交通信息抽取的技术内涵265
15.2.2 城市道路交通信息抽取技术框架267
15.3 IE在竞争情报研究中的应用268
第16章 基于自然语言处理的研究主题抽取271
16.1 问题描述271
16.2 研究主题抽取273
16.3 多语环境下的关键词语抽取274
16.4 研究主题聚类276
16.5 研究主题分析的实验结果278
第17章 IE在自动文摘中的应用285
17.1 问题描述285
17.2 单文档自动文摘285
17.2.1 自动文摘过程285
17.2.2 自动文摘方法286
17.3 多文档自动文摘288
17.4 自动文摘系统的测评291
第18章 IE在问答系统中的应用294
18.1 概述294
18.1.1 研究背景294
18.1.2 问答系统分类295
18.1.3 研究现状295
18.2 问答系统关键问题研究297
18.2.1 问题分析297
18.2.2 问题理解297
18.2.3 信息检索299
18.2.4 答案抽取299
参考文献303
结束语304
热门推荐
- 876165.html
- 1697726.html
- 2621095.html
- 975068.html
- 332020.html
- 1706021.html
- 2245632.html
- 1071927.html
- 1652833.html
- 2978367.html
- http://www.ickdjs.cc/book_37892.html
- http://www.ickdjs.cc/book_872518.html
- http://www.ickdjs.cc/book_1414765.html
- http://www.ickdjs.cc/book_3189607.html
- http://www.ickdjs.cc/book_1332020.html
- http://www.ickdjs.cc/book_2956661.html
- http://www.ickdjs.cc/book_2724007.html
- http://www.ickdjs.cc/book_2871214.html
- http://www.ickdjs.cc/book_516558.html
- http://www.ickdjs.cc/book_52563.html