• 主页 > 知识问答
  • DeepMind AI足球运动员进化简史:从AlphaGo到世界杯模拟赛

    今年11月,世界杯将重新开始。

    当时,无论您是否玩,无论您是否表现良好,许多人都会再次开始谈论足球。

    没有办法,谁说足球是世界上最大的运动?

    足球转圈射门游戏规则怎么说_足球射门游戏视频_足球射门的游戏规则

    但是,与世界杯相比,科学家对年度3D模拟联盟更感兴趣。

    不久前,英国人工智能公司DeepMind的一支研究团队使用了体育课程的加速版,通过计算机模拟数十年的足球比赛,训练AI学习巧妙地控制数字数字类人型足球运动员。

    相关研究发表在《科学机器人》杂志上。

    足球转圈射门游戏规则怎么说_足球射门的游戏规则_足球射门游戏视频

    显然,这不是“ AI足球运动员”第一次进入公众视线。

    AI足球运动员演变的简短历史

    早在2016年,在Alphago击败Lee Sedol的不久之后,DeepMind就开始考虑让AI踢足球。

    当年6月,DeepMind的研究人员要求AI控制一个蚂蚁形的对象,以追逐球,然后将球运球直至将球送入进球。

    DeepMind Group负责人David Silver在Google的最新异步演员 - 批判算法的帮助下,即A3C,AI不仅完成了该项目,而且在整个过程中不需要灌输有关机械的知识。

    该实验为“ AI踢足球”提供了一个良好的开端。

    到2019年,DeepMind培训了许多“球员”,这些“球员”是由不同的训练计划制成的,DeepMind选择了10个双足球队。

    这10个团队中的每支都有250亿帧的学习经验,而DeepMind在他们之间收集了100万场比赛。

    然后,DeepMind设置了一个环境,以允许多个AI一起玩足球比赛,并提前制定规则以奖励整个“足球队”,而不是鼓励某个“ AI球员”的个人成就来促进整个团队的进步。

    DeepMind以这种方式证明了AI可以彼此合作。

    足球射门的游戏规则_足球射门游戏视频_足球转圈射门游戏规则怎么说

    看起来一切顺利,但是到2020年,DeepMind的AI播放器出了问题。

    足球射门游戏视频_足球射门的游戏规则_足球转圈射门游戏规则怎么说

    根据Brainji提供的信息,在一场比赛中,一侧的足球机器人排队以射门,但是机器人守门员还没有准备好防守,但落在地面上,开始随机挥舞他的腿。 。

    您认为这已经结束了吗?太天真了!

    然后,曾担任前锋的机器人玩家跳舞了一个非常令人困惑的舞蹈,踩着脚,挥舞着他的手,用快速摔倒在地。

    这个场景震惊了观众:我见过一个放下水的人,但我从未见过有人像这样放下水!

    为什么会发生这种情况?

    这始于其背后的原理。

    在“ AI踢足球”开头,研究人员采用了强化学习的道路。

    以前,Alphago的学习是基于监督的学习,即通过标记的数据集培训。

    但是这种方法需要高“清洁”数据:一旦数据出现问题,AI就会犯错误。

    相反,强化学习是模仿人类学习模型。 AI以“反复试验”方式学习,并在正确时获得奖励,并在错误时进行惩罚,从而建立正确的连接。

    它似乎比传统的监督学习要聪明得多,但仍然存在漏洞。

    例如,AI将对奖励和惩罚措施有错误的理解,从而创造出奇怪的策略。

    Openai曾经设计了划船游戏,而AI的最初任务是完成比赛。

    研究人员设定了两种类型的奖励,一种是完成竞争,另一个是在环境中收集分数。结果是,代理商找到了一个他不断旋转和“清晰点”的区域。最后,他自然未能完成比赛,但他的得分更高。

    足球转圈射门游戏规则怎么说_足球射门游戏视频_足球射门的游戏规则

    这次,AI做了一些新技巧

    尽管AI在足球比赛中遇到了崩溃,但研究人员并未放弃。

    在文章的开头,DeepMind的研究团队在训练“ AI足球运动员”方面取得了新的突破。

    根据该论文,尽管DeepMind团队在这项研究中简化了游戏规则,并将两支球队的球员数量限制在2-3中,但“ AI足球运动员”可以完成诸如运球,身体对抗和准确的行动射击。 。

    那么研究人员如何训练“ AI足球运动员”?

    足球射门游戏视频_足球射门的游戏规则_足球转圈射门游戏规则怎么说

    简而言之,是将监督学习与强化学习结合在一起。

    第一步是AI需要观看人类踢足球并学会自然行走的视频片段,因为AI最初不知道在足球场上该怎么做。

    足球转圈射门游戏规则怎么说_足球射门的游戏规则_足球射门游戏视频

    第二步是,在加固学习算法下,AI练习运球和射击。

    这两个步骤可以在大约24小时内完成。

    第三步是以游戏的形式训练。 AI机器人玩2对2的比赛。此步骤需要2到3周。它主要允许AI学习团队合作并预测通过和其他困难的运动控制。

    足球射门的游戏规则_足球转圈射门游戏规则怎么说_足球射门游戏视频

    这次“ AI足球运动员”的表现仍然使研究团队更加满意。

    DeepMind团队认为,这项研究已促使人工系统朝着人类水平的运动智能发展。

    但是,DeepMind团队仍然相对清醒,他们知道这一突破仍然有局限性。

    例如,该游戏是2V2,而不是真正的足球比赛中常用的11V11,这并不意味着AI可以参加更复杂的足球比赛。

    此外,即使是简单的2V2游戏也无法直接在机器人硬件上使用。

    换句话说,科学家无法开发可以踢足球的机器人。

    Chuangyebang下的“有毒舌头技术”将与您合作探索新的未来技术场景和新趋势,并跟踪数字世界的建设的最前沿。每天晚上22:00见

    足球转圈射门游戏规则怎么说_足球射门的游戏规则_足球射门游戏视频

    足球转圈射门游戏规则怎么说_足球射门的游戏规则_足球射门游戏视频

    足球转圈射门游戏规则怎么说_足球射门的游戏规则_足球射门游戏视频

    有毒舌头技术l id:dushekeji

    按并握住QR码以一键关注

    版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.xinyuangyml.com/html/tiyuwenda/9437.html

    加载中~

    相关推荐

    加载中~