论文目录 | |
第一章 绪论 | 第1-17
页 |
1.1 研究的背景和意义 | 第9-10
页 |
1.2 语音识别简史和国内外研究现状 | 第10-14
页 |
1.2.1 语音识别简史 | 第10-12
页 |
1.2.2 语音识别研究现状 | 第12-14
页 |
1.3 本文的研究目标、主要贡献和内容组织 | 第14-17
页 |
第二章 汉语语言系统的信源特性 | 第17-26
页 |
2.1 引言 | 第17
页 |
2.2 用通信系统理论分析汉语的结构特点 | 第17-23
页 |
2.2.1 从通信系统的性能分析看语言系统的评价准则 | 第17-19
页 |
2.2.2 关于汉语的基本信源符号 | 第19-21
页 |
2.2.3 汉语的载信能力 | 第21-23
页 |
2.3 汉语语音结构的特征 | 第23-25
页 |
2.4 本章小结 | 第25-26
页 |
第三章 矢量的线上投影表示法 | 第26-43
页 |
3.1 引言 | 第26-27
页 |
3.2 矢量的线上投影表示法(VP)基本原理 | 第27-29
页 |
3.3 矢量的线上投影表示法(VP)码书设计 | 第29-30
页 |
3.4 线上投影表示的编码算法 | 第30-31
页 |
3.5 矢量线上投影表示法精度的理论分析 | 第31-39
页 |
3.6 实验结果 | 第39-41
页 |
3.6.1 脑电图(EEG)数据压缩实验 | 第39-40
页 |
3.6.2 语音识别用特征矢量MFCC压缩编码表示实验 | 第40-41
页 |
3.7 本章小结 | 第41-43
页 |
第四章 噪声环境下语音变异补偿的研究 | 第43-54
页 |
4.1 引言 | 第43-45
页 |
4.2 基于训练的加性噪声补偿原理 | 第45-47
页 |
4.3 Lombard和Loud变异语音的补偿原则 | 第47-49
页 |
4.4 噪声和语音变异的联合训练补偿 | 第49-50
页 |
4.5 实验结果 | 第50-53
页 |
4.5.1 实验条件 | 第50-51
页 |
4.5.2 实验结果 | 第51-53
页 |
4.6 本章小结 | 第53-54
页 |
第五章 语音识别拒识算法及应用研究 | 第54-65
页 |
5.1 引言 | 第54-55
页 |
5.2 隐马尔可夫模型状态及状态驻留相关的声学置信量度 | 第55-58
页 |
5.2.1 状态与特征矢量相关的两种声学置信准则 | 第55-56
页 |
5.2.2 状态驻留分布相关法声学置信准则 | 第56-58
页 |
5.3 基于汉语音节特点的部分拒识原则在语音识别搜索算法中的应用 | 第58-61
页 |
5.3.1 连续语流中汉语语音的音节结构特点和可采用的拒识策略 | 第58-59
页 |
5.3.2 基于部分匹配拒识原则的N—Best改进算法 | 第59-60
页 |
5.3.3 算法复杂度改进分析 | 第60-61
页 |
5.4 实验结果 | 第61-64
页 |
5.4.1 拒识准则有效性实验 | 第61-62
页 |
5.4.2 采用部分拒识准则的连续汉语数字识别实验 | 第62-64
页 |
5.5 本章小结 | 第64-65
页 |
第六章 汉语统计语言模型研究 | 第65-78
页 |
6.1 引言 | 第65-67
页 |
6.2 一种扩展的汉语统计二元文法语言模型 | 第67-72
页 |
6.2.1 二元文法模型基本系统的描述 | 第67-68
页 |
6.2.2 长距离词对信息的获取方法 | 第68-69
页 |
6.2.3 词对和词组合信息和二元模型的有效结合依据 | 第69-70
页 |
6.2.4 合乎要求词对信息搜索 | 第70-71
页 |
6.2.5 实验结果 | 第71-72
页 |
6.3 一种结合汉语音节音联信息的统计语言模型新方法 | 第72-77
页 |
6.3.1 声学模型部分描述及无话模型 | 第73-74
页 |
6.3.2 利用无话模型的状态驻留 | 第74-75
页 |
6.3.2.1 无话模型的模型驻留对词转移概率的影响 | 第74
页 |
6.3.2.2 d_(max)的确定 | 第74-75
页 |
6.3.3 例外情况 | 第75-76
页 |
6.3.4 实验结果 | 第76-77
页 |
6.4 本章小结 | 第77-78
页 |
结束语 | 第78-81
页 |
致 谢 | 第81-82
页 |
参考文献 | 第82-93
页 |
攻读博士学位期间发表的论文和著作 | 第93
页 |