AI玩赛车游戏登上Nature封面!击败人类冠军( 三 )


为了解决这个问题 , GTSophy的学习包括使用在每条赛道上可能至关重要的人工比赛情况进行混合场景训练 , 以及帮助智能体学习这些技能的专门对手 。 这些技能培养场景帮助GTSophy获得了专业的赛车技术 , 包括处理拥挤的起跑、弹弓式尾流超车 , 甚至防御机动 。
AI玩赛车游戏登上Nature封面!击败人类冠军
文章图片
▲GTSophy利用急转弯成功超车人类赛车手
(3)赛车礼仪:车手需要遵守具体规则 , 以限定赛车可以滑出赛道的程度 , 以及在发生碰撞时谁应该背责 。 与此同时 , 车手需要积极开车才能获胜 , 找到正确的平衡是一大挑战 。
为了帮助GTSophy学习运动礼仪 , SonyAI研究人员找到了将成文和不成本比赛规则编码为复杂奖励功能的方法 。 研究团队还发现 , 有必要平衡对手的数量 , 以确保GTSophy有竞争性的训练比赛 , 同时不会对人类竞争变得过于激进或胆怯 。
例如 , GTSophy在不堵塞驾驶线路的情况下超过了人类车手 , 给他们留下了足够的机动空间 , 展示出公平和体育精神 。
AI玩赛车游戏登上Nature封面!击败人类冠军
文章图片
这些特性 , 使得GTSophy与此前在一些经典游戏中击败人类冠军的早期AI智能体区分开来 。