并行强化学习研究
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→工业技术论文→
自动化技术、计算机技术论文
→
自动化基础理论论文
→
人工智能理论论文
→
自动推理、机器学习论文
并行强化学习研究
论文目录
中文摘要
第1-5页
Abstract
第5-9页
第一章 引言
第9-16页
· 研究背景及意义
第9-12页
· 国内外研究现状
第12-14页
· 主要工作
第14-15页
· 论文组织结构
第15-16页
第二章 强化学习理论及算法
第16-27页
· 强化学习简介
第16-17页
· 强化学习的基本原理
第17页
· 强化学习系统的关键要素
第17-20页
· 强化学习问题的建模
第20-21页
· 强化学习算法
第21-25页
· 强化学习算法的分类
第21-22页
· 强化学习算法效率的度量指标
第22-23页
· 几种常用的强化学习算法
第23-25页
· 并行强化学习
第25-26页
· 本章小结
第26-27页
第三章 基于状态空间分解和智能调度的并行强化学习
第27-49页
· IS-SRL和IS-SPRL方法
第27-37页
· 子问题的学习过程
第27-30页
· IS-SPRL方法的消息传递和调度
第30-32页
· 学习步骤
第32-33页
· 加权优先级调度算法
第33-37页
· 收敛性分析
第37-41页
· 模型和假设
第38-39页
· 基于IS-SRL和IS-SPRL方法的Q学习算法的收敛性
第39-41页
· 实验
第41-47页
· 实验3.1:不同调度算法的比较
第42-43页
· 实验3.2:算法在不同参数下的性能比较
第43-44页
· 实验3.3:不同算法的收敛速度的比较
第44-46页
· 结果分析
第46-47页
· 本章小结
第47-49页
第四章 基于资格迹的并行时间信度分配强化学习算法
第49-59页
· 资格迹与强化学习
第50-52页
· 并行时间信度分配
第52-54页
· 性能优化与系统容错
第54-55页
· 状态迁移预测
第54-55页
· 故障预防和恢复
第55页
· 实验
第55-58页
· 本章小结
第58-59页
第五章 基于并行采样和学习经验复用的E.算法
第59-71页
· E~3算法
第60-62页
· 学习经验复用
第62-63页
· 并行E~3算法
第63-66页
· 系统容错
第66页
· 实验
第66-70页
· 本章小结
第70-71页
第六章 总结与展望
第71-73页
· 工作总结
第71-72页
· 工作展望
第72-73页
参考文献
第73-78页
攻读硕士期间发表(录用)的论文和参与的科研项目
第78-80页
致谢
第80 页
本篇论文共
80
页,
点击这进入下载页面
。
更多论文
并行强化学习研究
TD公司车间物料配送优化研究
基于TileCoding的函数逼近强化学习
高新技术企业高管激励、股权集中度
基于ARM的便携式电池检测设备
SimpliciTI在无线火灾实时监测系统
一种三维硅霍尔传感器的研制
智能路灯测控与安全系统的研制
基于价值网络商业模式的财务绩效研
心血管疾病的远程监控系统设计
拉伸机专用上下料机械手的设计与控
面向特定领域的Deep Web数据获取技
类TCAM的数据网络查找协处理器芯片
基于二分网络的协同推荐研究
三维彩码图像水印算法的设计与实现
长江经济带金融中心体系研究
基于SSM的某高校教室管理信息系统的
基于结构特征的本体匹配算法研究与
数据包络分析在债券型基金绩效评价
基于Nhibernate技术的库存管理系统
基于Linux的智能仓库引导系统
高中教师网络测评系统的研究与设计
单样本条件下的人脸识别算法研究
上市公司要约收购案例研究--以st生
基于双目立体视觉的瓜子三维特殊形
CPU/GPU平台下分布式集合求交算法的
中文事件抽取与缺失角色填充的研究
基于iOS的2D第三人称射击游戏引擎的
基于关联规则算法的中职教务管理系
顺丰速运借壳上市的绩效分析研究
结合眼动数据的图像特征选择算法研
嵌入式移动数据库应用中复制技术的
基于云计算的A公司会计信息化应用研
基于SIFT特征的图像相似性检索技术
基于显著区域检测的图像语义层次管
数据流上多聚集查询的优化技术
面向显著区域的图像多特征融合检索
基于供给侧改革的鞍钢股份财务绩效
基于DM3730的人脸识别系统设计
SRAM IP实速测试系统设计与测试
Ge
2
Sb
2
Te
大数据背景下企业内部审计信息化问
基于Linux的嵌入式Web服务器的实现
基于ARM控制的全自动单纱强力仪设计
多核处理器的加速比研究与热设计
养老保险基金绩效审计研究--以F市养
应用于太空通信的LTP协议的研究
基于混合天线模式无线自组网的MAC协
基于SNMP的传感器网络分层管理技术
基于地脉动信号分析的台风强度估计
无线传感器网络极大生命周期路由研
有界提取模型下自适应泄漏弹性加密
深海保压防污物采样器设计与研究
基于因子分析和支持向量机的耳语说
具有阻带特性的小型化超宽带天线的
高增益双极化基站天线的设计与实现
并行强化学习论文
状态空间分解论文
资格迹论文
并行采样论文
版权申明
:目录由用户
liuna197911**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved