教育论文网

基于深度强化学习的移动机器人导航策略研究

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化技术及设备论文机器人技术论文机器人论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文
基于深度强化学习的移动机器人导航策略研究
论文目录
 
摘要第1-6页
ABSTRACT第6-7页
第一章 绪论第14-20页
    1.1 研究背景及意义第14-15页
    1.2 国内外研究现状第15-17页
    1.3 本文的主要研究工作及章节安排第17-20页
        1.3.1 本文的主要研究工作第17-19页
        1.3.2 本文的组织结构第19-20页
第二章 相关理论基础第20-29页
    2.1 深度学习第20-21页
        2.1.1 深度学习基本思想第20页
        2.1.2 卷积神经网络第20-21页
    2.2 强化学习第21-27页
        2.2.1 马尔科夫决策过程(MDP)第22-23页
        2.2.2 价值函数和贝尔曼方程第23-24页
        2.2.3 策略迭代与值迭代第24-25页
        2.2.4 经典强化学习算法第25-27页
    2.3 深度强化学习第27-28页
        2.3.1 基于值函数第27-28页
        2.3.2 基于策略梯度第28页
    2.4 本章小结第28-29页
第三章 基于值函数的深度强化学习移动机器人导航策略研究第29-38页
    3.1 图像处理第29-31页
        3.1.1 图像预处理第29页
        3.1.2 DQN网络参数预处理第29-31页
    3.2 基于DQN的深度强化学习算法第31-37页
        3.2.1 DQN训练流程第31-32页
        3.2.2 目标值函数第32-33页
        3.2.3 关键技术第33-34页
        3.2.4 搜索与利用平衡策略第34-36页
        3.2.5 基于DQN的移动机器人导航算法伪代码第36-37页
        3.2.6 DQN算法实验第37页
    3.3 本章小结第37-38页
第四章 基于确定性策略梯度的深度强化学习移动机器人导航策略研究第38-49页
    4.1 策略梯度第38-40页
    4.2 搜索策略第40页
    4.3 基于DDPG的深度强化学习算法第40-47页
        4.3.1 Actor-Critic算法第40-42页
        4.3.2 DPG算法第42-43页
        4.3.3 基于DDPG算法的网络模型第43-44页
        4.3.4 DDPG算法训练流程第44-46页
        4.3.5 基于DDPG的移动机器人导航算法伪代码第46-47页
        4.3.6 DDPG算法实验第47页
    4.4 本章小结第47-49页
第五章 仿真实验结果与分析第49-58页
    5.1 仿真实验平台描述第49-50页
        5.1.1 软硬件实验平台第49页
        5.1.2 实验仿真平台第49-50页
    5.2 奖励函数设置第50-51页
    5.3 实验参数设置第51-52页
    5.4 实验结果第52-57页
        5.4.1 初始场景下的导航仿真实验结果第52-53页
        5.4.2 增量场景下的导航仿真实验结果第53-56页
        5.4.3 算法对比分析第56-57页
    5.5 本章小结第57-58页
总结与展望第58-60页
参考文献第60-64页
攻读学位期间发表的论文第61-66页
致谢第66页

本篇论文共66页,点击这进入下载页面
 
更多论文
基于深度强化学习的移动机器人导航
YT公司光盘的自动化质量控制研究
一汽丰田烟台市场营销创新研究
大型制造企业技术创新项目风险管理
集团公司战略EVA评价方法研究
基于深度神经网络的单幅图像去雨研
LD医疗设备企业营销渠道管理研究
基于稀疏编码的多特征视频异常事件
中小制造业企业技术创新体系研究
基于复合混沌和变换域的图像加密算
TZ公司企业发展战略研究
精益生产方式在A公司的应用研究
网络用户社区中用户创新的组织采纳
A热电公司薪酬体系优化研究
济钢重工国际营销战略研究
小家电企业特销渠道研究
C供电公司可靠性人员绩效管理体系改
QD数字家电产业集群(基地)发展战
格力电器股权激励案例研究
F公司生产管理人员绩效管理方案优化
XX电力公司组织结构再设计
作业成本法在铝合金铸造企业的应用
中国水务行业竞争政策分析研究--基
鲁西化工装备公司竞争战略研究
GCMC工程机械股份有限公司相关多元
未知环境下深度学习在SLAM闭环检测
面向智能头显的眼动跟踪技术的研究
山工机械6Sigma管理优化研究
农民专业合作社发展问题研究--以济
无线可充电传感器网络高效在线充电
改革开放以来农民收入问题研究
枣庄市农村土地使用权制度改革研究
莱芜市出口农产品质量安全示范区建
巨能公司玉米深加工业务竞争战略研
H集团饲料业务竞争战略研究
多边贸易体制中农业谈判的政治经济
山东邮政农村物流业务发展研究
移动边缘计算中的端到端任务分配算
沾化县农业产业化发展策略研究
山东省农民专业合作社的发展研究
基于能量图与自适应粒子滤波的移动
中国农村家庭养老问题研究--以冀东
新型农村社会养老保险制度的可持续
新型农村社会养老保险替代率水平和
我国农村低保制度的问题与对策研究
山东省上市公司对区域经济发展贡献
“跨太平洋战略经济伙伴关系协定”
大数据CPS的系统的系统建模方法
财政支农与城乡收入差距--基于2000
税收调节居民收入分配研究
经济学中的知识交易:一个基于交易
制度的形成与演变
WY住宅工业公司发展战略研究
济南市城市管理中街头摊贩治理研究
基于商业银行视角的中小企业信贷违
资本账户开放与货币危机的关系研究
基于HPSO与强化学习的巡查机器人路
基于DEA与因子分析法的上市银行竞争
货币政策操作对股票市场价格影响的
我国保障性住房建设研究及政策建议
基于改进的协同过滤个性化音乐推荐
 
深度强化学习论文 移动机器人论文 导航 变化环境论文
版权申明:目录由用户gann**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved