基于强化学习的坦克大战python语言实现-软件开发指导

基于强化学习的坦克大战python语言实现

2年前更新

02316

这个项目是基于一个人工智能算法（基于全连接线性BP网络的增强学习模型）代理玩经典游戏坦克大战。在个游戏中，机器控制的坦克主要目标是射击敌方坦克并保卫自家的根据地。
游戏中坦克的动作空间有两个维度组成：
• 移动方向：【上、下、左、右】
• 动作：【射击】

界面结构如下所示：

图片[1]-基于强化学习的坦克大战python语言实现-软件开发指导

输入的特征：坦克执行以下操作的动作，特征尺度大小：200

子弹位置、方向
敌人的位置、方向和类型
邻近的地图信息
自家坦克和敌人坦克的距离
敌人坦克到基地的距离

将每个原子动作作为一个独立的option,除了原先动作集中的原子动作外,根据学习任务另外抽象出若干个复杂option,并将这些option作为一种特殊的“动作”加入到原来的动作集中,option 间的转移通过BP神经网络来表示。详见代码。设计的模型结构如下所示：

图片[2]-基于强化学习的坦克大战python语言实现-软件开发指导

训练过程如下：

图片[3]-基于强化学习的坦克大战python语言实现-软件开发指导

图片[4]-基于强化学习的坦克大战python语言实现-软件开发指导

最终实现的坦克大战，可以实现人为操作和机器自动运行。

完成注释下图代码即可

图片[5]-基于强化学习的坦克大战python语言实现-软件开发指导

深度强化学习在游戏领域中有着广泛的应用，使用深度强化学习方法训练的智能体能在一些游戏上有接近人类玩家的表现。本设计并实现了一个坦克对战游戏环境，并将深度强化学习应用到游戏中，使用 BP强化学习练智能体，使智能体程序能在游戏中获胜。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

Python项目
# 深度学习 # 强化学习 # ai # AI游戏

喜欢就支持一下吧

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交

暂无评论内容