极术小姐姐 · 2023年06月29日 · 北京市

用多代理强化学习构建动态的、吸引人的移动游戏

image.png

在第一部分中,我们对我们的《糖果冲突》演示进行了总体概述。第二部分更深入地探讨了AI代理的设计方式。

三种类型的兔子角色

在演示中,所有三种类型的兔子代理看起来都是一样的,有相同的输入和输出。输入是以射线发射和矢量的形式给出的。你可以把射线发射看作是感知兔子周围环境的激光器,它们用于探测墙壁、鸡蛋以及与队友或对手的距离和角度。每个代理发出17条射线,蛋的位置也作为向量提供。总共有244个输入数据点。这些输入被送入一个NN模型,该模型输出代理人的运动或攻击行动。我们使用的NN模型具有简单的多层感知器(MLP)结构,有一个隐藏单元和64个隐藏单元。虽然这种模型结构对所有三种类型的兔子代理是共同的,但每种类型都有独特的政策,这意味着它们有不同的模型权重。

作者:Koki Mitsunami
文章来源:https://community.arm.com/arm-community-blogs/b/ai-and-ml-blog/posts/p2-multi-agent-reinforcement-learning

欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。

推荐阅读
关注数
23518
内容数
971
Arm相关的技术博客,提供最新Arm技术干货,欢迎关注
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息