教育论文网

基于增强学习的智能车辆自主决策方法研究

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文自动推理、机器学习论文
分类2:教育论文网→交通运输论文→公路运输论文汽车工程论文汽车结构部件论文电气设备及附件论文
基于增强学习的智能车辆自主决策方法研究
论文目录
 
摘要第1-11页
ABSTRACT第11-12页
第一章 绪论第13-23页
    1.1 本文研究背景第13-14页
    1.2 智能驾驶车辆研究现状第14-16页
        1.2.1 国外研究现状第14-15页
        1.2.2 国内研究现状第15-16页
    1.3 驾驶行为决策研究现状及问题分析第16-17页
        1.3.1 驾驶行为决策研究现状第16-17页
        1.3.2 驾驶行为决策问题分析第17页
    1.4 增强学习研究现状第17-19页
        1.4.1 基于值函数逼近的方法第18页
        1.4.2 近似动态规划算法第18页
        1.4.3 基于策略搜索的方法第18-19页
        1.4.4 结构化增强学习方法第19页
        1.4.5 增强学习方法应用现状第19页
    1.5 论文的组织结构和主要贡献第19-23页
        1.5.1 本文的组织结构第19-21页
        1.5.2 本文的主要贡献第21-23页
第二章 增强学习理论基础与最小二乘策略迭代算法第23-32页
    2.1 增强学习理论基础第23-27页
        2.1.1 增强学习的相关概念第23-24页
        2.1.2 马尔可夫决策过程第24-26页
        2.1.3 TD学习理论第26-27页
    2.2 近似策略迭代算法及其特征表示方法第27-29页
        2.2.1 近似策略迭代方法概述第27-28页
        2.2.2 常用的特征表示方法第28-29页
    2.3 基于核的最小二乘策略迭代算法概述第29-30页
        2.3.1 最小二乘策略迭代算法概述第29-30页
        2.3.2 基于核的最小二乘策略迭代算法第30页
    2.4 本章小结第30-32页
第三章 基于多核的最小二乘策略迭代算法第32-46页
    3.1 近似策略迭代算法的基本框架第32-33页
    3.2 基于多核的最小二乘策略迭代MKLSPI算法第33-39页
        3.2.1 核函数的引入与核稀疏化方法第33-36页
        3.2.2 基于核稀疏方法的MKLSPI算法第36-39页
    3.3 仿真研究第39-45页
        3.3.1 Mountain-car实验仿真研究第39-42页
        3.3.2 Pendulum学习控制问题仿真研究第42-45页
    3.4 本章小结第45-46页
第四章 高速公路环境下智能车换道决策的增强学习方法第46-65页
    4.1 高速公路环境下智能车换道决策问题第46-50页
        4.1.1 高速公路环境简述第46-47页
        4.1.2 动态车流条件下的自主换道决策问题第47-49页
        4.1.3 智能车换道决策研究现状第49-50页
    4.2 仿真环境概述及智能车自主换道决策问题MDP建模第50-53页
        4.2.1 仿真环境概述第50-52页
        4.2.2 动态车流环境中智能车自主换道决策问题MDP建模第52-53页
    4.3 基于增强学习的动态车流条件下智能车辆自主换道决策方法第53-59页
        4.3.1 基于增强学习的智能车自主换道决策方法第53-57页
        4.3.2 基于增强学习的智能车辆驾驶决策系统第57-59页
    4.4 动态车流环境中智能车驾驶自主换道决策仿真研究第59-64页
        4.4.1 仿真环境下离线采样第59页
        4.4.2 基于MKLSPI算法的自主换道决策仿真研究第59-61页
        4.4.3 MKLSPI算法与KLSPI算法仿真结果对比第61-62页
        4.4.4 基于不同驾驶风格的驾驶决策策略仿真第62-64页
    4.5 本章小结第64-65页
第五章 基于实时感知数据的智能车自主换道决策性能测试第65-74页
    5.1 实验平台简述第65-67页
        5.1.1 硬件配置第65-66页
        5.1.2 软件系统第66-67页
    5.2 高速公路自主驾驶决策性能测试第67-73页
        5.2.1 实验场景介绍第67-68页
        5.2.2 实验结果与分析讨论第68-73页
    5.3 本章小结第73-74页
第六章 总结与展望第74-77页
    6.1 论文工作总结第74-75页
    6.2 展望第75-77页
致谢第77-78页
参考文献第78-87页
作者在学期间取得的学术成果第87页

本篇论文共87页,点击这进入下载页面
 
更多论文
基于增强学习的智能车辆自主决策方
基于压缩感知理论的海洋重力测量航
基于博弈论的北京市民营建筑企业工
基于博弈模型的能源互联网需求侧交
基于动态搜索粒子群算法的自适应滤
商业银行资金风险管理系统的设计与
关于邮政资费规制问题的研究
区域覆盖空间信息网络结构多目标优
玉米植株性状QTL的遗传背景和环境稳
云计算模式下审计风险评估方法研究
旅游景区游客满意度研究
海航波音767客机租赁项目案例分析
不确定环境下突发事件应急处置方案
合肥市新企业创立与早期成长的实证
中小软件企业员工绩效管理研究
不平衡时间序列多分类问题研究
基于深度学习的人群计数方法研究
X-DSP IP核Power函数部件的设计与验
黑潮延伸体海温异常及其对北太平洋
高超声速飞行器鸭舵自适应滚转控制
高超声速飞机水平起飞腹部襟翼增升
中小学网校发展研究
基于证据推理的企业研发人员绩效评
高超声速滑翔飞行器轨迹优化与制导
高超声速滑翔飞行器低可探测性外形
高超声速巡航飞行器总体设计参数可
高超声速巡航导弹爬升段轨迹优化研
高超声速变形飞行器建模与纵向鲁棒
民营企业二次创业中投资项目选择与
精益生产方式在现代中小企业生产管
高精度算法隐式时间推进方法研究
屯溪老街旅游开发战略研究
风廓线雷达探测垂直气流和大气边界
风场中平流层飞艇轨迹控制方法
预冷压缩吸气式发动机系统方案设计
面向高性能计算系统的高通量作业处
皖能集团“十一五”酒店事业发展对
面向旋翼无人机集群的端到端视觉伺
低温晶片键合的实验和动力学特性研
面向多层卫星星座的空间信息网络架
面向MOOC的个性化推荐关键技术研究
非Kolmogorov湍流对激光大气传输影
雷达欺骗干扰信号识别技术研究
间歇采样转发干扰特性研究与抗干扰
锂硫电池用LiPFSD单离子聚合物电解
基于网格的决策支持系统(GBODSS)
铝合金反射镜超精密抛光关键技术研
北京CBD区域邮政经营策略研究
辐射带AP9模式量化评估技术研究
超短超强激光与固体靶相互作用驱动
超燃冲压发动机再生冷却通道内碳氢
人工老化与引发对大葱种子活力及幼
超标量处理器能效优化关键技术研究
超宽带脉冲信号源技术研究
超声速钝后缘混合层及其主动控制特
超声速混合层波瓣混合器混合增强机
超声速气流气态碳氢燃料激光诱导等
超声速气流中燃料射流流场设计优化
超声速气流中增强爆震稳定性数值研
超声速剪切层流场中的激波串流场结
超临界煤油涡轮泵设计与工作特性研
贝叶斯压缩感知SAR成像技术
触觉通道脑机接口范式研究
视频卫星多目标凝视成像任务规划问
视频人物聚类与关联分析研究
基于Web Services的心理咨询系统的
装备数据建模及查询优化技术研究
融合主题特征的深度学习文本分类技
薄层等离子体—频率选择表面复合结
药物潜在靶标预测模型及算法研究
芯片阱上离子的稳定囚禁
舱内辅助机器人视觉导航与控制方法
航天测控与数传任务动态处理模式与
 
智能车辆论文 自主换道决策论文 增强学习论文 特征表示论文
版权申明:目录由用户a38822575**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved