教育论文网

强化学习及其在MAS协同概念设计中应用的研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文自动推理、机器学习论文
强化学习及其在MAS协同概念设计中应用的研究
论文目录
 
摘要第1-7 页
ABSTRACT第7-9 页
目录第9-12 页
1.绪论第12-32 页
  1.1.课题背景与意义第12-13 页
  1.2.强化学习的基本原理及其与相关学科关系第13-16 页
    1.2.1.强化学习的基本原理第14 页
    1.2.2.强化学习研究的相关学科背景第14-16 页
  1.3.强化学习研究现状第16-21 页
    1.3.1.强化学习的发展历史第16-17 页
    1.3.2.经典的强化学习算法及其发展第17-20 页
    1.3.3.强化学习的应用研究第20-21 页
    1.3.4.有待进一步研究的问题第21 页
  1.4.基于MAS的协同概念设计研究现状第21-28 页
    1.4.1.协同概念设计的内涵第22-23 页
    1.4.2.MAS概述第23-25 页
    1.4.3.基于MAS的协同概念设计第25-28 页
  1.5.论文组织结构第28-29 页
  1.6.本文的主要成果和创新点第29-32 页
2.基于模拟退火Metropolis准则的多步Q强化学习第32-55 页
  2.1.引言第32 页
  2.2.MDP与动态规划第32-36 页
    2.2.1.MDP模型第32-34 页
    2.2.2.Bellman最优性原理第34-35 页
    2.2.3.值迭代与策略迭代第35-36 页
  2.3.强化学习的经典算法第36-41 页
    2.3.1.TD学习算法第36-38 页
    2.3.2.Q学习第38-39 页
    2.3.3.Q(λ)学习第39-41 页
    2.3.4.参数λ的意义第41 页
  2.4.多步Q强化学习算法第41-48 页
    2.4.1.算法提出第41-43 页
    2.4.2.算法分析第43-45 页
    2.4.3.k值的确定第45 页
    2.4.4.仿真试验第45-48 页
  2.5.基于Metropolis准则的多步Q强化学习算法第48-53 页
    2.5.1.模拟退火算法第48-49 页
    2.5.2.结合Metropolis准则的多步Q学习算法第49-50 页
    2.5.3.算法分析第50-51 页
    2.5.4.仿真实验第51-53 页
  2.6.本章小结第53-55 页
3.基于最小二乘的强化学习第55-75 页
  3.1.引言第55 页
  3.2.值函数逼近第55-58 页
    3.2.1.函数逼近的TD学习第56-57 页
    3.2.2.函数逼近的Q(λ)算法第57-58 页
  3.3.最小二乘Q(λ)强化学习方法第58-66 页
    3.3.1.最小二乘Q(λ)学习第58-60 页
    3.3.2.递推最小二乘Q(λ)学习第60-61 页
    3.3.3.算法分析第61 页
    3.3.4.仿真实验与结果分析第61-66 页
  3.4.最小二乘SARSA(λ)算法第66-73 页
    3.4.1.强化学习的SARSA(λ)算法第66-67 页
    3.4.2.最小二乘SARSA(λ)算法第67-69 页
    3.4.3.递推最小二乘SARSA(λ)学习第69-70 页
    3.4.4.仿真实验与结果分析第70-73 页
    3.4.5.最小二乘Q(λ)和SARSA(λ)算法的对比第73 页
  3.5.本章小结第73-75 页
4.基于MAS的协同概念设计系统研究第75-93 页
  4.1.引言第75 页
  4.2.协同概念设计的特点与模型第75-79 页
    4.2.1.协同概念设计的特点第75-76 页
    4.2.2.协同概念设计的集成模型第76-77 页
    4.2.3.基于MAS的协同概念设计系统的总体思想第77-79 页
  4.3.协同概念设计系统的Agent建模方法第79 页
  4.4.基于MAS的协同概念设计系统第79-85 页
    4.4.1.系统体系结构第80-81 页
    4.4.2.管理Agent第81-83 页
    4.4.3.设计Agent第83-85 页
  4.5.基于信念型承诺的Agent协作机制第85-91 页
    4.5.1.通用部分全局规划概述第85-86 页
    4.5.2.信念型承诺的提出第86-87 页
    4.5.3.基于信念型承诺的Agent协作机制第87-90 页
    4.5.4.基于信念型承诺的Agent协作在协同概念设计系统中的应用第90-91 页
  4.6.基于MAS的协同概念设计系统实现第91-92 页
  4.7.本章小结第92-93 页
5.强化学习在协同概念设计系统中的应用第93-109 页
  5.1.引言第93 页
  5.2.协同设计任务调度的强化学习方法研究第93-104 页
    5.2.1.任务调度问题的研究现状分析第94-95 页
    5.2.2.协同设计任务调度问题描述第95-96 页
    5.2.3.任务调度问题的MDP模型第96-98 页
    5.2.4.任度调度的强化学习算法第98-99 页
    5.2.5.应用实例与分析第99-104 页
  5.3.强化学习在协同概念设计方案优化中的应用第104-107 页
    5.3.1.方案优化问题的MDP模型第104-106 页
    5.3.2.基于强化学习的方案优化算法第106 页
    5.3.3.应用实例分析第106-107 页
  5.4.本章小结第107-109 页
6.结束语第109-112 页
致谢第112-113 页
参考文献第113-123 页
攻读博士学位期间发表和录用的论文第123 页

本篇论文共123页,点击这进入下载页面
 
更多论文
强化学习及其在MAS协同概念设计中应
基于最小割集的配电系统可靠性评估
混沌系统的若干同步方法研究
安康电厂水轮发电机组运行稳定性分
大型混流式水轮机参数选择研究
基于解释性与精确性的模糊建模方法
黄河李家峡水电站Ⅱ号滑坡稳定性分
网络控制系统的控制与调度研究
HL240型水轮机转轮改型研究与应用
基于LMI方法的广义系统的稳定性与保
黄河上游梯级水电效益分析及增强竞
切换系统的若干问题研究
华阴市南山支流洪水灾害成因及其对
一类切换线性系统的分析与控制
小浪底水库运用后黄河下游游荡性河
GPS/SINS/MMW复合制导关键技术研究
西安市城市供水水源合理配置研究
3mm波段主被动复合探测技术研究
齿轮连杆机构运动与力分析的可视化
基于声强测量技术的噪声自动分析系
大高宽比典型微型传动元件的研究
Fe-1.5C-1.5Cr-xAl超高碳钢组织转变
压力表的图像检定法研究
大型压缩机动力学分析与噪声预测
考虑运动副间隙商标模切机主切机构
数字化预装配环境下装配序列快速规
组合式无级变速器的主动设计、参数
卫星红外辐射特性研究
不同类型孔隙水压力的动力效应研究
线性爆炸成型侵彻体形成机理研究
军品贮运包装要求及木箱结构CAD系统
引信与武器系统信息交联中的光学装
塔里木河流域水资源管理基础信息系
石羊河流域民勤盆地水资源供需平衡
航空弹药供应保障决策支持系统研究
铝合金微弧氧化陶瓷层生长过程及绝
车载式火炮武器总体技术研究
酸析—厌氧—好氧处理碱法草浆黑液
高能量高强度发射药研究
高效复合镀铬添加剂的研究
基于声强知识与神经网络融合技术的
玉门川流域生态环境建设与生态农业
青海湖水位下降的成因分析与对策
系列多胺相关配合物的结构、量子化
宁夏水资源承载力研究
嘌呤2,6位取代衍生物的合成
汉江上游梯级水电开发模式研究
膦酰基羧酸的合成与性能
基于INTERNET的石油物资采购电子商
纳米稀土氧化物的控制制备及其催化
W_f/Zr基块体金属玻璃复合材料及其
攀枝花钢铁(集团)公司竞争力研究
配位聚合物的合成、表征及性能研究
H型钢项目后效益评价方法应用的研究
碳纳米管基复合粒子的制备及其应用
基于多Agent的模式识别框架APRF的研
印刷机故障诊断专家系统的研究开发
含荧光基团低聚物的合成及在水处理
柔性版四色印刷呈色数学模型的研究
液态碳氢燃料云雾爆轰及其抑制与泄
复杂边界河道流场及污染物输移数值
被动式遥感FTIR技术的应用与发展
燃爆消减剂的理论与应用基础研究
水环境中金属离子的液膜分离研究
系列金属氧化物纳米晶的制备、结构
西安市水资源开发利用潜力分析
有机阻垢缓蚀剂作用机理的理论研究
叶尔羌河流域水资源最优调配研究
纳米TiO2复合材料的制备
过冷Ni-Pb偏晶合金凝固组织及凝固行
镁合金微弧氧化膜层制备技术及其耐
计算系统的自恢复模型构建和自愈策
灰铸铁干砂消失模铸造充型特性研究
聚碳酸酯与高支化聚苯乙烯共混改性
钢的马氏体相变形核与板条晶宽纳米
化学计量学在遥感FTIR谱图解析中的
Ni3Al的显微组织与压缩
生物修复环境污染的微生物筛选及其
铝锌阻尼合金的组织和阻尼性能研究
三氟甲基化及二氟环丙烷化反应的研
渭南市水资源优化配置研究
氟两相体系中的有机合成反应
一拖KW静压线浇注和补缩技术应用研
供应链环境下库存控制的系统动力学
弧面分度凸轮的廓面误差补偿及基于
基于循环经济的企业竞争力评价研究
汉中市水资源合理配置研究
面向随机协作的柔性管理信息系统框
非限定手写体汉字分割与多类别票据
渭河临潼断面以上流域非点源总氮负
内置旋转扭带强化传热机理及清洗动
难降解有机污染物的光催化氧化研究
弹道一致性与通用射表界定判据的理
MW1050自动烫印模切机间歇输纸系统
基于图像的目标自动识别与跟踪技术
 
强化学习论文 Q学习论文 时间差分学习论文 Q(λ)学习论文 最小二乘论文 多Agent系统论文 概念设计论文 协同设计论文
版权申明:目录由用户z**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved