强化学习及其在MAS协同概念设计中应用的研究



强化学习及其在MAS协同概念设计中应用的研究

分类：教育论文网→工业技术论文→自动化技术、计算机技术论文→自动化基础理论论文→人工智能理论论文→自动推理、机器学习论文

强化学习及其在MAS协同概念设计中应用的研究

论文目录
摘要	第1-7 页
ABSTRACT	第7-9 页
目录	第9-12 页
1.绪论	第12-32 页
1.1.课题背景与意义	第12-13 页
1.2.强化学习的基本原理及其与相关学科关系	第13-16 页
1.2.1.强化学习的基本原理	第14 页
1.2.2.强化学习研究的相关学科背景	第14-16 页
1.3.强化学习研究现状	第16-21 页
1.3.1.强化学习的发展历史	第16-17 页
1.3.2.经典的强化学习算法及其发展	第17-20 页
1.3.3.强化学习的应用研究	第20-21 页
1.3.4.有待进一步研究的问题	第21 页
1.4.基于MAS的协同概念设计研究现状	第21-28 页
1.4.1.协同概念设计的内涵	第22-23 页
1.4.2.MAS概述	第23-25 页
1.4.3.基于MAS的协同概念设计	第25-28 页
1.5.论文组织结构	第28-29 页
1.6.本文的主要成果和创新点	第29-32 页
2.基于模拟退火Metropolis准则的多步Q强化学习	第32-55 页
2.1.引言	第32 页
2.2.MDP与动态规划	第32-36 页
2.2.1.MDP模型	第32-34 页
2.2.2.Bellman最优性原理	第34-35 页
2.2.3.值迭代与策略迭代	第35-36 页
2.3.强化学习的经典算法	第36-41 页
2.3.1.TD学习算法	第36-38 页
2.3.2.Q学习	第38-39 页
2.3.3.Q(λ)学习	第39-41 页
2.3.4.参数λ的意义	第41 页
2.4.多步Q强化学习算法	第41-48 页
2.4.1.算法提出	第41-43 页
2.4.2.算法分析	第43-45 页
2.4.3.k值的确定	第45 页
2.4.4.仿真试验	第45-48 页
2.5.基于Metropolis准则的多步Q强化学习算法	第48-53 页
2.5.1.模拟退火算法	第48-49 页
2.5.2.结合Metropolis准则的多步Q学习算法	第49-50 页
2.5.3.算法分析	第50-51 页
2.5.4.仿真实验	第51-53 页
2.6.本章小结	第53-55 页
3.基于最小二乘的强化学习	第55-75 页
3.1.引言	第55 页
3.2.值函数逼近	第55-58 页
3.2.1.函数逼近的TD学习	第56-57 页
3.2.2.函数逼近的Q(λ)算法	第57-58 页
3.3.最小二乘Q(λ)强化学习方法	第58-66 页
3.3.1.最小二乘Q(λ)学习	第58-60 页
3.3.2.递推最小二乘Q(λ)学习	第60-61 页
3.3.3.算法分析	第61 页
3.3.4.仿真实验与结果分析	第61-66 页
3.4.最小二乘SARSA(λ)算法	第66-73 页
3.4.1.强化学习的SARSA(λ)算法	第66-67 页
3.4.2.最小二乘SARSA(λ)算法	第67-69 页
3.4.3.递推最小二乘SARSA(λ)学习	第69-70 页
3.4.4.仿真实验与结果分析	第70-73 页
3.4.5.最小二乘Q(λ)和SARSA(λ)算法的对比	第73 页
3.5.本章小结	第73-75 页
4.基于MAS的协同概念设计系统研究	第75-93 页
4.1.引言	第75 页
4.2.协同概念设计的特点与模型	第75-79 页
4.2.1.协同概念设计的特点	第75-76 页
4.2.2.协同概念设计的集成模型	第76-77 页
4.2.3.基于MAS的协同概念设计系统的总体思想	第77-79 页
4.3.协同概念设计系统的Agent建模方法	第79 页
4.4.基于MAS的协同概念设计系统	第79-85 页
4.4.1.系统体系结构	第80-81 页
4.4.2.管理Agent	第81-83 页
4.4.3.设计Agent	第83-85 页
4.5.基于信念型承诺的Agent协作机制	第85-91 页
4.5.1.通用部分全局规划概述	第85-86 页
4.5.2.信念型承诺的提出	第86-87 页
4.5.3.基于信念型承诺的Agent协作机制	第87-90 页
4.5.4.基于信念型承诺的Agent协作在协同概念设计系统中的应用	第90-91 页
4.6.基于MAS的协同概念设计系统实现	第91-92 页
4.7.本章小结	第92-93 页
5.强化学习在协同概念设计系统中的应用	第93-109 页
5.1.引言	第93 页
5.2.协同设计任务调度的强化学习方法研究	第93-104 页
5.2.1.任务调度问题的研究现状分析	第94-95 页
5.2.2.协同设计任务调度问题描述	第95-96 页
5.2.3.任务调度问题的MDP模型	第96-98 页
5.2.4.任度调度的强化学习算法	第98-99 页
5.2.5.应用实例与分析	第99-104 页
5.3.强化学习在协同概念设计方案优化中的应用	第104-107 页
5.3.1.方案优化问题的MDP模型	第104-106 页
5.3.2.基于强化学习的方案优化算法	第106 页
5.3.3.应用实例分析	第106-107 页
5.4.本章小结	第107-109 页
6.结束语	第109-112 页
致谢	第112-113 页
参考文献	第113-123 页
攻读博士学位期间发表和录用的论文	第123 页

本篇论文共123页，点击这进入下载页面。

更多论文
强化学习及其在MAS协同概念设计中应
基于最小割集的配电系统可靠性评估
混沌系统的若干同步方法研究
安康电厂水轮发电机组运行稳定性分
大型混流式水轮机参数选择研究
基于解释性与精确性的模糊建模方法
黄河李家峡水电站Ⅱ号滑坡稳定性分
网络控制系统的控制与调度研究
HL240型水轮机转轮改型研究与应用
基于LMI方法的广义系统的稳定性与保
黄河上游梯级水电效益分析及增强竞
切换系统的若干问题研究
华阴市南山支流洪水灾害成因及其对
一类切换线性系统的分析与控制
小浪底水库运用后黄河下游游荡性河
GPS/SINS/MMW复合制导关键技术研究
西安市城市供水水源合理配置研究
3mm波段主被动复合探测技术研究
齿轮连杆机构运动与力分析的可视化
基于声强测量技术的噪声自动分析系
大高宽比典型微型传动元件的研究
Fe-1.5C-1.5Cr-xAl超高碳钢组织转变
压力表的图像检定法研究
大型压缩机动力学分析与噪声预测
考虑运动副间隙商标模切机主切机构
数字化预装配环境下装配序列快速规
组合式无级变速器的主动设计、参数
卫星红外辐射特性研究
不同类型孔隙水压力的动力效应研究
线性爆炸成型侵彻体形成机理研究
军品贮运包装要求及木箱结构CAD系统
引信与武器系统信息交联中的光学装
塔里木河流域水资源管理基础信息系
石羊河流域民勤盆地水资源供需平衡
航空弹药供应保障决策支持系统研究
铝合金微弧氧化陶瓷层生长过程及绝
车载式火炮武器总体技术研究
酸析—厌氧—好氧处理碱法草浆黑液
高能量高强度发射药研究
高效复合镀铬添加剂的研究
基于声强知识与神经网络融合技术的
玉门川流域生态环境建设与生态农业
青海湖水位下降的成因分析与对策
系列多胺相关配合物的结构、量子化
宁夏水资源承载力研究
嘌呤2，6位取代衍生物的合成
汉江上游梯级水电开发模式研究
膦酰基羧酸的合成与性能
基于INTERNET的石油物资采购电子商
纳米稀土氧化物的控制制备及其催化
W_f/Zr基块体金属玻璃复合材料及其
攀枝花钢铁（集团）公司竞争力研究
配位聚合物的合成、表征及性能研究
H型钢项目后效益评价方法应用的研究
碳纳米管基复合粒子的制备及其应用
基于多Agent的模式识别框架APRF的研
印刷机故障诊断专家系统的研究开发
含荧光基团低聚物的合成及在水处理
柔性版四色印刷呈色数学模型的研究
液态碳氢燃料云雾爆轰及其抑制与泄
复杂边界河道流场及污染物输移数值
被动式遥感FTIR技术的应用与发展
燃爆消减剂的理论与应用基础研究
水环境中金属离子的液膜分离研究
系列金属氧化物纳米晶的制备、结构
西安市水资源开发利用潜力分析
有机阻垢缓蚀剂作用机理的理论研究
叶尔羌河流域水资源最优调配研究
纳米TiO₂复合材料的制备
过冷Ni-Pb偏晶合金凝固组织及凝固行
镁合金微弧氧化膜层制备技术及其耐
计算系统的自恢复模型构建和自愈策
灰铸铁干砂消失模铸造充型特性研究
聚碳酸酯与高支化聚苯乙烯共混改性
钢的马氏体相变形核与板条晶宽纳米
化学计量学在遥感FTIR谱图解析中的
Ni₃Al的显微组织与压缩
生物修复环境污染的微生物筛选及其
铝锌阻尼合金的组织和阻尼性能研究
三氟甲基化及二氟环丙烷化反应的研
渭南市水资源优化配置研究
氟两相体系中的有机合成反应
一拖KW静压线浇注和补缩技术应用研
供应链环境下库存控制的系统动力学
弧面分度凸轮的廓面误差补偿及基于
基于循环经济的企业竞争力评价研究
汉中市水资源合理配置研究
面向随机协作的柔性管理信息系统框
非限定手写体汉字分割与多类别票据
渭河临潼断面以上流域非点源总氮负
内置旋转扭带强化传热机理及清洗动
难降解有机污染物的光催化氧化研究
弹道一致性与通用射表界定判据的理
MW1050自动烫印模切机间歇输纸系统
基于图像的目标自动识别与跟踪技术

强化学习论文 Q学习论文时间差分学习论文 Q(λ)学习论文最小二乘论文多Agent系统论文概念设计论文协同设计论文
版权申明：目录由用户z**提供，www.51papers.com仅收录目录，作者需要删除这篇论文目录请点击这里。
\| 设为首页\|\|加入收藏\|\|站内搜索引擎\|\|站点地图\|\|在线购卡\|
版权所有教育论文网 Copyright(C) All Rights Reserved