基于马尔可夫决策过程理论的Agent决策问题研究
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→工业技术论文→
自动化技术、计算机技术论文
→
自动化基础理论论文
→
人工智能理论论文
基于马尔可夫决策过程理论的Agent决策问题研究
论文目录
摘要
第1-5页
ABSTRACT
第5-7页
目录
第7-10页
图表目录
第10-11页
第1章 绪论
第11-24页
· 人工智能与Agent 决策
第11-12页
· 马尔可夫决策过程
第12-18页
· 基本模型
第13-14页
· 世界状态
第14-15页
· 行动
第15页
· 状态转移函数
第15-16页
· 收益函数
第16-17页
· 值函数与策略求解
第17-18页
· 其他决策模型介绍
第18-20页
· 实验平台
第20-22页
· RoboCup 机器人世界杯
第20-21页
· RoboCup 仿真2D 机器人足球比赛
第21-22页
· WrightEagle 仿真2D 机器人足球队
第22页
· 本文的主要工作及章节安排
第22-24页
第2章 WE2009 仿真2D 球队决策系统
第24-38页
· RoboCup 仿真2D 平台
第24-27页
· Server 端
第25-26页
· Client 端
第26-27页
· 理论模型
第27-29页
· POSG 的基本模型
第27-28页
· WE2009 的POSG 建模
第28-29页
· 系统结构分析
第29-37页
· 系统决策流程
第30-31页
· 信息处理模块
第31-32页
· 高层决策模块
第32-36页
· 行为执行模块
第36-37页
· 小结
第37-38页
第3章 行动驱动的马尔可夫决策过程
第38-52页
· 问题的提出
第38-39页
· 理论模型
第39-40页
· 求解算法
第40-44页
· MDP 的经典求解算法
第40-41页
· ADMDP 的精确求解算法
第41-43页
· ADMDP 的启发式求解算法
第43-44页
· 不离身带球问题的求解
第44-47页
· 问题分析
第45页
· 模型建立
第45-47页
· 实验结果及分析
第47-51页
· 小结
第51-52页
第4章 基于阵型的零和马尔可夫博弈
第52-66页
· 博弈论相关背景
第52-55页
· 博弈与零和博弈
第53-54页
· 零和马尔可夫博弈
第54-55页
· 理论模型及应用实例
第55-59页
· 角色与阵型
第55-56页
· 理论模型
第56-57页
· Anti-Mark 问题中的应用
第57-59页
· Anti-Mark 问题的求解
第59-63页
· 多角色异构分配策略
第59-60页
· 阵型变换策略
第60-63页
· 实验结果及分析
第63-64页
· 小结
第64-66页
第5章 总结与展望
第66-68页
· 总结
第66页
· 展望
第66-68页
参考文献
第68-72页
致谢
第72-74页
攻读学位期间发表的学术论文与取得的其他研究成果
第74页
本篇论文共
74
页,
点击这进入下载页面
。
更多论文
基于马尔可夫决策过程理论的Agent决
用于异常检测的进化非选择算法性能
支持向量机逆系统控制方法的研究与
智能交通行人检测系统的分类技术研
大规模浮动车数据处理的研究与实现
智能仪器外部接口的设计与实现
自动阻抗匹配器检测电路设计及匹配
快速静电探针测量仪的设计和开发
多模型广义预测解耦控制
基于声信号处理的交通事故自动检测
基于NetLinx架构的远程控制系统设计
双足机器人的建模与稳定性分析
多个刚体姿态同步的输出反馈控制
生物启发式算法及其改进研究
足球机器人协调控制系统研究
基于ZigBee的楼宇多节点网络控制系
非球面液滴透镜及阵列制作平台控制
螺旋叉指电极的压电圆盘扭转致动器
球面复眼多通道信息融合
基于ZigBee的区域无线控制系统
仿鲹科机器鱼推进性能实验研究
基于无线传感器网络的运动系统设计
资源受限下的多传感器融合技术
基于多尺度特征的遥感云图分类
基于特征的多源遥感图像配准研究
基于光学遥感图像的舰船目标自动检
高速通用数据采集平台的设计与实现
遗传算法的一些改进及其应用
遥感图像目标识别效果评估研究
我国网络媒体在食品安全事件中的报
《心理访谈》青少年心理健康类节目
Web2.0环境下在线实践社群的发展策
关于时间序列预测在流媒体服务中应
美国组织传播20年的范式研究
媒介融合背景下我国出版集团产业价
高校师生心理契约及其在教学中的应
高校师生心理契约演变及违背破裂的
英语课件的交互设计研究
大学权力治理结构对人才培养和科学
基于DEA效率的高校科研评价研究
反腐倡廉形势评估研究
中国特色社会主义理论体系形成与发
我国群体性事件形成、演化与防控机
论中小企业融资途径的法律创新
基于计算机的大学英语口语考试系统
基于多平台的个性化词汇学习系统
基于Joomla!框架的基础英语E-Learn
基于大学英语立体化教材的出版传播
高畑勋动画电影现实主义问题研究--
从拉康的主体间性谈伯格曼电影中的
辽西地区出土青铜器的科学分析
脂类物质分析技术运用于考古学的方
西汉星云镜铸造工艺模拟实验
《庄子》“自由”观及其思想价值研
高校师生心理契约学生性别差异及其
中国典型高硒与硒缺乏区硒营养摄入
青蒿素的生物素标记及青藤碱的荧光
转录因子E2F1对树突状细胞成熟的抑
低毒性硒在化疗中的应用研究
高尔基磷酸化蛋白2(GOLPH2)与肺癌
B23通过抑制Eg5ATP酶活性抑制Eg5对
分子印记聚合物的制备及其在药物检
高效液相色谱-质谱联用在药物分析中
江浙蝮蛇毒凝血因子IX/X结合蛋白的
基于ANN和SVM的sEMG信号分解
人工智能论文
Agent决策论文
多Agent系统论文
马尔可夫决策过程论文
马尔可夫博弈论文
RoboCup论文
仿真2D论文
版权申明
:目录由用户
陈**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved