教育论文网

并行强化学习研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文自动推理、机器学习论文
并行强化学习研究
论文目录
 
中文摘要第1-5页
Abstract第5-9页
第一章 引言第9-16页
  · 研究背景及意义第9-12页
  · 国内外研究现状第12-14页
  · 主要工作第14-15页
  · 论文组织结构第15-16页
第二章 强化学习理论及算法第16-27页
  · 强化学习简介第16-17页
  · 强化学习的基本原理第17页
  · 强化学习系统的关键要素第17-20页
  · 强化学习问题的建模第20-21页
  · 强化学习算法第21-25页
    · 强化学习算法的分类第21-22页
    · 强化学习算法效率的度量指标第22-23页
    · 几种常用的强化学习算法第23-25页
  · 并行强化学习第25-26页
  · 本章小结第26-27页
第三章 基于状态空间分解和智能调度的并行强化学习第27-49页
  · IS-SRL和IS-SPRL方法第27-37页
    · 子问题的学习过程第27-30页
    · IS-SPRL方法的消息传递和调度第30-32页
    · 学习步骤第32-33页
    · 加权优先级调度算法第33-37页
  · 收敛性分析第37-41页
    · 模型和假设第38-39页
    · 基于IS-SRL和IS-SPRL方法的Q学习算法的收敛性第39-41页
  · 实验第41-47页
    · 实验3.1:不同调度算法的比较第42-43页
    · 实验3.2:算法在不同参数下的性能比较第43-44页
    · 实验3.3:不同算法的收敛速度的比较第44-46页
    · 结果分析第46-47页
  · 本章小结第47-49页
第四章 基于资格迹的并行时间信度分配强化学习算法第49-59页
  · 资格迹与强化学习第50-52页
  · 并行时间信度分配第52-54页
  · 性能优化与系统容错第54-55页
    · 状态迁移预测第54-55页
    · 故障预防和恢复第55页
  · 实验第55-58页
  · 本章小结第58-59页
第五章 基于并行采样和学习经验复用的E.算法第59-71页
  · E~3算法第60-62页
  · 学习经验复用第62-63页
  · 并行E~3算法第63-66页
  · 系统容错第66页
  · 实验第66-70页
  · 本章小结第70-71页
第六章 总结与展望第71-73页
  · 工作总结第71-72页
  · 工作展望第72-73页
参考文献第73-78页
攻读硕士期间发表(录用)的论文和参与的科研项目第78-80页
致谢第80 页

本篇论文共80页,点击这进入下载页面
 
更多论文
并行强化学习研究
TD公司车间物料配送优化研究
基于TileCoding的函数逼近强化学习
高新技术企业高管激励、股权集中度
基于ARM的便携式电池检测设备
SimpliciTI在无线火灾实时监测系统
一种三维硅霍尔传感器的研制
智能路灯测控与安全系统的研制
基于价值网络商业模式的财务绩效研
心血管疾病的远程监控系统设计
拉伸机专用上下料机械手的设计与控
面向特定领域的Deep Web数据获取技
类TCAM的数据网络查找协处理器芯片
基于二分网络的协同推荐研究
三维彩码图像水印算法的设计与实现
长江经济带金融中心体系研究
基于SSM的某高校教室管理信息系统的
基于结构特征的本体匹配算法研究与
数据包络分析在债券型基金绩效评价
基于Nhibernate技术的库存管理系统
基于Linux的智能仓库引导系统
高中教师网络测评系统的研究与设计
单样本条件下的人脸识别算法研究
上市公司要约收购案例研究--以st生
基于双目立体视觉的瓜子三维特殊形
CPU/GPU平台下分布式集合求交算法的
中文事件抽取与缺失角色填充的研究
基于iOS的2D第三人称射击游戏引擎的
基于关联规则算法的中职教务管理系
顺丰速运借壳上市的绩效分析研究
结合眼动数据的图像特征选择算法研
嵌入式移动数据库应用中复制技术的
基于云计算的A公司会计信息化应用研
基于SIFT特征的图像相似性检索技术
基于显著区域检测的图像语义层次管
数据流上多聚集查询的优化技术
面向显著区域的图像多特征融合检索
基于供给侧改革的鞍钢股份财务绩效
基于DM3730的人脸识别系统设计
SRAM IP实速测试系统设计与测试
Ge2Sb2Te
大数据背景下企业内部审计信息化问
基于Linux的嵌入式Web服务器的实现
基于ARM控制的全自动单纱强力仪设计
多核处理器的加速比研究与热设计
养老保险基金绩效审计研究--以F市养
应用于太空通信的LTP协议的研究
基于混合天线模式无线自组网的MAC协
基于SNMP的传感器网络分层管理技术
基于地脉动信号分析的台风强度估计
无线传感器网络极大生命周期路由研
有界提取模型下自适应泄漏弹性加密
深海保压防污物采样器设计与研究
基于因子分析和支持向量机的耳语说
具有阻带特性的小型化超宽带天线的
高增益双极化基站天线的设计与实现
 
并行强化学习论文 状态空间分解论文 资格迹论文 并行采样论文
版权申明:目录由用户liuna197911**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved