论文目录 | |
独创性声明 | 第1
页 |
关于论文使用授权的说明 | 第2-3
页 |
摘要 | 第3-5
页 |
Abstract | 第5-7
页 |
目录 | 第7-10
页 |
图片索引 | 第10-11
页 |
表格索引 | 第11-12
页 |
第1章、动机、定位与目标 | 第12-22
页 |
·研究内容 | 第12
页 |
·启发与动机 | 第12-14
页 |
·知识、发现与获取 | 第14-16
页 |
· 知识的分类 | 第14-15
页 |
·知识、知识发现与知识获取 | 第15-16
页 |
·实用主义与我们的目标 | 第16-17
页 |
·实用的价值 | 第17-19
页 |
·本文的提纲 | 第19-22
页 |
第1部、词相关性知识的无导获取 | 第22-98
页 |
第2章、词相关性知识无导获取的框架 | 第24-44
页 |
·背景介绍 | 第24-30
页 |
·手工词语知识库 | 第24-26
页 |
·词语知识的自动获取 | 第26-30
页 |
·我们的目标和方法 | 第30-43
页 |
·我们的目标 | 第30-31
页 |
·方法的渊源 | 第31-34
页 |
·向量空间模型 | 第31-34
页 |
·词空间 | 第34
页 |
·我们的方法 | 第34-43
页 |
·模型的选择 | 第34-35
页 |
·我们方法的特点 | 第35-36
页 |
·我们的方法 | 第36-41
页 |
·词相关性知识获取的框架 | 第41-43
页 |
·本章小结 | 第43-44
页 |
第3章、上下文有效范围的定量描述 | 第44-56
页 |
·背景介绍 | 第44-46
页 |
·问题的提出和意义 | 第44-45
页 |
·已有研究 | 第45
页 |
·我们的策略 | 第45-46
页 |
·词语上下文有效范围的定量描述 | 第46-53
页 |
·词语上下文位置信息量的确定 | 第46-49
页 |
·词语上下文矩阵的符号信息系统 | 第46-47
页 |
·信息增益及其在上下文位置信息量确定中的应用 | 第47-48
页 |
·上下文位置信息量的计算结果及其分析 | 第48-49
页 |
·上下文有效范围的量化确定 | 第49-53
页 |
·上下文位置信息量函数 | 第49-52
页 |
·上下文有效范围的确定 | 第52-53
页 |
·方法的局限性 | 第53-54
页 |
·分析与讨论 | 第54-56
页 |
第4章、信息、降维与噪音 | 第56-82
页 |
·信息与“噪音” | 第56-59
页 |
·标准与手段 | 第56-57
页 |
·定义“噪音” | 第57-59
页 |
·单属性降维和噪音消除 | 第59-61
页 |
·上下文词语的权重计算 | 第59-60
页 |
·降维与消除噪音 | 第60-61
页 |
·线性降维与消除噪音 | 第61-65
页 |
·主成分分析技术 | 第62-63
页 |
·PCA技术与消除噪音 | 第63-65
页 |
·多义词的词义消歧 | 第65-81
页 |
·背景介绍 | 第66-69
页 |
·已有的词义消歧无导方法 | 第67-68
页 |
·已有的词义消歧有导方法 | 第68-69
页 |
·我们的方法 | 第69-81
页 |
·基于义项向量的词义消歧有导方法 | 第70-74
页 |
· 基于义项词语的词义消歧“半自动”方法 | 第74-81
页 |
·结论 | 第81
页 |
·本章小结 | 第81-82
页 |
第5章、二维可视化、词距离及验证实验 | 第82-98
页 |
·二维可视化验证与“累计方差贡献率”的确定 | 第82-90
页 |
·维可视化与自组织特征映射(Self-Organizing Maps) | 第82-85
页 |
·二维显示验证 | 第85-89
页 |
·%“累计方差贡献率”的假设与推广 | 第89-90
页 |
·提问与解释 | 第90
页 |
·距离方法的选择 | 第90-92
页 |
·距离计算函数 | 第90-91
页 |
·相似度计算函数 | 第91
页 |
·距离测度的选择 | 第91-92
页 |
·词相关性知识的验证实验 | 第92-95
页 |
·知识获取步骤和相关数据 | 第92-93
页 |
·应用词相关性知识的必要条件 | 第93
页 |
·Memory-Based Learning | 第93-94
页 |
·验证实验及其结果 | 第94-95
页 |
·得与失 | 第95-98
页 |
第2部、面向自然语言处理的均衡分类器 | 第98-134
页 |
第6章、RMBL分类器的构建 | 第102-116
页 |
·有导符号机器学习 | 第102-106
页 |
·覆盖法 | 第103-104
页 |
·分治法 | 第104
页 |
·Lazy Learning | 第104-105
页 |
·Inductive Logic Programming | 第105-106
页 |
·面向自然语言处理RMBL分类器的构建 | 第106-116
页 |
·“鸡肋”的尴尬 | 第106
页 |
·问题的关键 | 第106-108
页 |
·我们的目标 | 第108
页 |
·粗集与自然语言处理 | 第108-111
页 |
·Memory-Based Learning与自然语言处理 | 第111-112
页 |
·我们的RMBL分类器 | 第112-116
页 |
第7章、RMBL分类器实验验证及其他 | 第116-130
页 |
·验证实验 | 第116-126
页 |
·实验Ⅰ:汉语多义词词义消歧 | 第116-121
页 |
·知识获取阶段的实验过程及数据 | 第116-118
页 |
·分类推理阶段的实验过程及数据 | 第118-121
页 |
·实验Ⅱ:英语介词短语消歧(Prepositional Phrase Attachment) | 第121-125
页 |
·训练集与测试集 | 第122-123
页 |
·知识获取阶段的实验过程及数据 | 第123
页 |
·分类推理阶段的实验过程及数据 | 第123-125
页 |
·实验结论 | 第125-126
页 |
·相关工作 | 第126-128
页 |
·讨论与结论 | 第128-130
页 |
·方法的局限性 | 第128-129
页 |
·比较与分析 | 第129
页 |
·总结论 | 第129-130
页 |
第8章、切身的体会 | 第130-134
页 |
附录 | 第134-148
页 |
[附录1] 对应分析的特征值和特征向量求解算法 | 第134-136
页 |
[附录2] PCA的MATLAB代码 | 第136-138
页 |
[附录3] 对应分析的MATLAB代码 | 第138-140
页 |
[附录4] RMBL在汉语多义词词义消歧中提取的规则 | 第140-146
页 |
[附录5] RMBL在英文介词短语归并问题(PP)提取的规则 | 第146-148
页 |
参考文献 | 第148-156
页 |
作者简介 | 第156-158
页 |
攻读博士学位期间发表论文 | 第158-160
页 |
致谢 | 第160-162页 |