今年11月,世界杯将重新开始。
当时,无论您是否玩,无论您是否表现良好,许多人都会再次开始谈论足球。
没有办法,谁说足球是世界上最大的运动?
但是,与世界杯相比,科学家对年度3D模拟联盟更感兴趣。
不久前,英国人工智能公司DeepMind的一支研究团队使用了体育课程的加速版,通过计算机模拟数十年的足球比赛,训练AI学习巧妙地控制数字数字类人型足球运动员。
相关研究发表在《科学机器人》杂志上。
显然,这不是“ AI足球运动员”第一次进入公众视线。
AI足球运动员演变的简短历史
早在2016年,在Alphago击败Lee Sedol的不久之后,DeepMind就开始考虑让AI踢足球。
当年6月,DeepMind的研究人员要求AI控制一个蚂蚁形的对象,以追逐球,然后将球运球直至将球送入进球。
DeepMind Group负责人David Silver在Google的最新异步演员 - 批判算法的帮助下,即A3C,AI不仅完成了该项目,而且在整个过程中不需要灌输有关机械的知识。
该实验为“ AI踢足球”提供了一个良好的开端。
到2019年,DeepMind培训了许多“球员”,这些“球员”是由不同的训练计划制成的,DeepMind选择了10个双足球队。
这10个团队中的每支都有250亿帧的学习经验,而DeepMind在他们之间收集了100万场比赛。
然后,DeepMind设置了一个环境,以允许多个AI一起玩足球比赛,并提前制定规则以奖励整个“足球队”,而不是鼓励某个“ AI球员”的个人成就来促进整个团队的进步。
DeepMind以这种方式证明了AI可以彼此合作。
看起来一切顺利,但是到2020年,DeepMind的AI播放器出了问题。
根据Brainji提供的信息,在一场比赛中,一侧的足球机器人排队以射门,但是机器人守门员还没有准备好防守,但落在地面上,开始随机挥舞他的腿。 。
您认为这已经结束了吗?太天真了!
然后,曾担任前锋的机器人玩家跳舞了一个非常令人困惑的舞蹈,踩着脚,挥舞着他的手,用快速摔倒在地。
这个场景震惊了观众:我见过一个放下水的人,但我从未见过有人像这样放下水!
为什么会发生这种情况?
这始于其背后的原理。
在“ AI踢足球”开头,研究人员采用了强化学习的道路。
以前,Alphago的学习是基于监督的学习,即通过标记的数据集培训。
但是这种方法需要高“清洁”数据:一旦数据出现问题,AI就会犯错误。
相反,强化学习是模仿人类学习模型。 AI以“反复试验”方式学习,并在正确时获得奖励,并在错误时进行惩罚,从而建立正确的连接。
它似乎比传统的监督学习要聪明得多,但仍然存在漏洞。
例如,AI将对奖励和惩罚措施有错误的理解,从而创造出奇怪的策略。
Openai曾经设计了划船游戏,而AI的最初任务是完成比赛。
研究人员设定了两种类型的奖励,一种是完成竞争,另一个是在环境中收集分数。结果是,代理商找到了一个他不断旋转和“清晰点”的区域。最后,他自然未能完成比赛,但他的得分更高。
这次,AI做了一些新技巧
尽管AI在足球比赛中遇到了崩溃,但研究人员并未放弃。
在文章的开头,DeepMind的研究团队在训练“ AI足球运动员”方面取得了新的突破。
根据该论文,尽管DeepMind团队在这项研究中简化了游戏规则,并将两支球队的球员数量限制在2-3中,但“ AI足球运动员”可以完成诸如运球,身体对抗和准确的行动射击。 。
那么研究人员如何训练“ AI足球运动员”?
简而言之,是将监督学习与强化学习结合在一起。
第一步是AI需要观看人类踢足球并学会自然行走的视频片段,因为AI最初不知道在足球场上该怎么做。
第二步是,在加固学习算法下,AI练习运球和射击。
这两个步骤可以在大约24小时内完成。
第三步是以游戏的形式训练。 AI机器人玩2对2的比赛。此步骤需要2到3周。它主要允许AI学习团队合作并预测通过和其他困难的运动控制。
这次“ AI足球运动员”的表现仍然使研究团队更加满意。
DeepMind团队认为,这项研究已促使人工系统朝着人类水平的运动智能发展。
但是,DeepMind团队仍然相对清醒,他们知道这一突破仍然有局限性。
例如,该游戏是2V2,而不是真正的足球比赛中常用的11V11,这并不意味着AI可以参加更复杂的足球比赛。
此外,即使是简单的2V2游戏也无法直接在机器人硬件上使用。
换句话说,科学家无法开发可以踢足球的机器人。
Chuangyebang下的“有毒舌头技术”将与您合作探索新的未来技术场景和新趋势,并跟踪数字世界的建设的最前沿。每天晚上22:00见
有毒舌头技术l id:dushekeji
按并握住QR码以一键关注
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.xinyuangyml.com/html/tiyuwenda/9437.html