论文目录 | |
目录 | 第1-6
页 |
摘要 | 第6-8
页 |
Abstract | 第8-11
页 |
第一章 基于机器学习方法建立蛋白质结构域与配体相互作用的预测系统 | 第11-76
页 |
· 前言 | 第12-15
页 |
· 材料与方法 | 第15-25
页 |
· 结构域三维结构的收集和相互作用接触面(interface)位点的选取 | 第15-19
页 |
· 相互作用数据的收集 | 第19
页 |
· 相互作用的多肽序列的表示 | 第19-20
页 |
·两种机器学习算法 | 第20-22
页 |
· 预测效果的评价 | 第22
页 |
· 三种预测方法的整合 | 第22-23
页 |
· 体外高通量筛选相互作用实验数据的获得 | 第23
页 |
· 酵母双杂交方法筛选随机多肽库的实验数据获得 | 第23-25
页 |
· 结果与讨论 | 第25-36
页 |
· 模型的建立 | 第25-26
页 |
· 预测系统的特异性——从蛋白质数据库中筛选结构域结合的配体并与实验结果比较 | 第26-29
页 |
· 预测系统的灵敏度——与酵母双杂交筛选随机多肽库的结果比较 | 第29
页 |
· 对新类别配体的预测 | 第29-30
页 |
· 从交叉验证结果估计预测系统筛库的精确度(Estimated Screening Precision) | 第30-34
页 |
· 从配体蛋白的序列预测可能结合的结构域 | 第34
页 |
· 讨论:应用机器学习方法解决生物学问题 | 第34-35
页 |
· 讨论(2) | 第35-36
页 |
· 结论 | 第36-37
页 |
参考文献 | 第37-41
页 |
附录 | 第41-76
页 |
附表1:613个PDZ结构域上参与相互作用的氨基酸残基 | 第41-61
页 |
附表2:学习集的338对相互作用 | 第61-72
页 |
附表3:Erbin PDZ结构域结合配体 | 第72-73
页 |
附表4:三个PDZ结构域结合配体的预测结果 | 第73-76
页 |
第二章 应用Logistic回归提高串联质谱鉴定多肽的准确度 | 第76-100
页 |
· 前言 | 第77-79
页 |
· 材料与方法 | 第79-84
页 |
· MS/MS实验数据的获得 | 第79-80
页 |
· 利用SEQUEST软件进行数据库检索 | 第80-82
页 |
· Logistic回归模型 | 第82-83
页 |
· 本文使用的统计方法 | 第83-84
页 |
· 结果 | 第84-95
页 |
· 模型的建立 | 第84-88
页 |
· Oscore在标准蛋白数据集上的表现 | 第88-90
页 |
· Oscore在蛋白质组水平的复杂数据集上的表现 | 第90-92
页 |
· Oscore比PeptideProphet具有更好表现的原因探讨 | 第92-93
页 |
· 鉴定非完全酶切的多肽的尝试 | 第93-95
页 |
· 讨论 | 第95-96
页 |
· 结论 | 第96-97
页 |
参考文献 | 第97-100
页 |
综述 应用计算方法预测蛋白质相互作用的研究进展 | 第100-111
页 |
个人简历 | 第111-112
页 |
在读期间学术成果 | 第112-113
页 |
致谢 | 第113-114
页 |
发表论文 | 第114-131页 |