教育论文网

基于马尔可夫决策过程理论的Agent决策问题研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文
基于马尔可夫决策过程理论的Agent决策问题研究
论文目录
 
摘要第1-5页
ABSTRACT第5-7页
目录第7-10页
图表目录第10-11页
第1章 绪论第11-24页
  · 人工智能与Agent 决策第11-12页
  · 马尔可夫决策过程第12-18页
    · 基本模型第13-14页
    · 世界状态第14-15页
    · 行动第15页
    · 状态转移函数第15-16页
    · 收益函数第16-17页
    · 值函数与策略求解第17-18页
  · 其他决策模型介绍第18-20页
  · 实验平台第20-22页
    · RoboCup 机器人世界杯第20-21页
    · RoboCup 仿真2D 机器人足球比赛第21-22页
    · WrightEagle 仿真2D 机器人足球队第22页
  · 本文的主要工作及章节安排第22-24页
第2章 WE2009 仿真2D 球队决策系统第24-38页
  · RoboCup 仿真2D 平台第24-27页
    · Server 端第25-26页
    · Client 端第26-27页
  · 理论模型第27-29页
    · POSG 的基本模型第27-28页
    · WE2009 的POSG 建模第28-29页
  · 系统结构分析第29-37页
    · 系统决策流程第30-31页
    · 信息处理模块第31-32页
    · 高层决策模块第32-36页
    · 行为执行模块第36-37页
  · 小结第37-38页
第3章 行动驱动的马尔可夫决策过程第38-52页
  · 问题的提出第38-39页
  · 理论模型第39-40页
  · 求解算法第40-44页
    · MDP 的经典求解算法第40-41页
    · ADMDP 的精确求解算法第41-43页
    · ADMDP 的启发式求解算法第43-44页
  · 不离身带球问题的求解第44-47页
    · 问题分析第45页
    · 模型建立第45-47页
  · 实验结果及分析第47-51页
  · 小结第51-52页
第4章 基于阵型的零和马尔可夫博弈第52-66页
  · 博弈论相关背景第52-55页
    · 博弈与零和博弈第53-54页
    · 零和马尔可夫博弈第54-55页
  · 理论模型及应用实例第55-59页
    · 角色与阵型第55-56页
    · 理论模型第56-57页
    · Anti-Mark 问题中的应用第57-59页
  · Anti-Mark 问题的求解第59-63页
    · 多角色异构分配策略第59-60页
    · 阵型变换策略第60-63页
  · 实验结果及分析第63-64页
  · 小结第64-66页
第5章 总结与展望第66-68页
  · 总结第66页
  · 展望第66-68页
参考文献第68-72页
致谢第72-74页
攻读学位期间发表的学术论文与取得的其他研究成果第74页

本篇论文共74页,点击这进入下载页面
 
更多论文
基于马尔可夫决策过程理论的Agent决
用于异常检测的进化非选择算法性能
支持向量机逆系统控制方法的研究与
智能交通行人检测系统的分类技术研
大规模浮动车数据处理的研究与实现
智能仪器外部接口的设计与实现
自动阻抗匹配器检测电路设计及匹配
快速静电探针测量仪的设计和开发
多模型广义预测解耦控制
基于声信号处理的交通事故自动检测
基于NetLinx架构的远程控制系统设计
双足机器人的建模与稳定性分析
多个刚体姿态同步的输出反馈控制
生物启发式算法及其改进研究
足球机器人协调控制系统研究
基于ZigBee的楼宇多节点网络控制系
非球面液滴透镜及阵列制作平台控制
螺旋叉指电极的压电圆盘扭转致动器
球面复眼多通道信息融合
基于ZigBee的区域无线控制系统
仿鲹科机器鱼推进性能实验研究
基于无线传感器网络的运动系统设计
资源受限下的多传感器融合技术
基于多尺度特征的遥感云图分类
基于特征的多源遥感图像配准研究
基于光学遥感图像的舰船目标自动检
高速通用数据采集平台的设计与实现
遗传算法的一些改进及其应用
遥感图像目标识别效果评估研究
我国网络媒体在食品安全事件中的报
《心理访谈》青少年心理健康类节目
Web2.0环境下在线实践社群的发展策
关于时间序列预测在流媒体服务中应
美国组织传播20年的范式研究
媒介融合背景下我国出版集团产业价
高校师生心理契约及其在教学中的应
高校师生心理契约演变及违背破裂的
英语课件的交互设计研究
大学权力治理结构对人才培养和科学
基于DEA效率的高校科研评价研究
反腐倡廉形势评估研究
中国特色社会主义理论体系形成与发
我国群体性事件形成、演化与防控机
论中小企业融资途径的法律创新
基于计算机的大学英语口语考试系统
基于多平台的个性化词汇学习系统
基于Joomla!框架的基础英语E-Learn
基于大学英语立体化教材的出版传播
高畑勋动画电影现实主义问题研究--
从拉康的主体间性谈伯格曼电影中的
辽西地区出土青铜器的科学分析
脂类物质分析技术运用于考古学的方
西汉星云镜铸造工艺模拟实验
《庄子》“自由”观及其思想价值研
高校师生心理契约学生性别差异及其
中国典型高硒与硒缺乏区硒营养摄入
青蒿素的生物素标记及青藤碱的荧光
转录因子E2F1对树突状细胞成熟的抑
低毒性硒在化疗中的应用研究
高尔基磷酸化蛋白2(GOLPH2)与肺癌
B23通过抑制Eg5ATP酶活性抑制Eg5对
分子印记聚合物的制备及其在药物检
高效液相色谱-质谱联用在药物分析中
江浙蝮蛇毒凝血因子IX/X结合蛋白的
基于ANN和SVM的sEMG信号分解
 
人工智能论文 Agent决策论文 多Agent系统论文 马尔可夫决策过程论文 马尔可夫博弈论文 RoboCup论文 仿真2D论文
版权申明:目录由用户陈**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved