首页  »  科学  »  科学探索

玩躲猫猫游戏 AI学会攻防术

2019-09-19 08:07:19

来源: 科技日报

??? 尽管机器学习在诸如围棋和Dota?2等复杂游戏中取得了显著进步,但在这些领域掌握的技能并不一定能推广到真实场景中实际应用。越来越多的研究人员正在寻求建立一种机器智能,使其行为、学习和进化更像人类。

????总部位于旧金山的OpenAI公司近日发表的一篇新论文提出,在儿童的“躲猫猫”游戏中训练模型,并在数以千万计的竞赛中使它们相互对抗,可导致模型自动发展出类似人类的行为,从而提高智力并改善后续行动的性能。

????为什么选择躲猫猫?

????该论文的第一作者、OpenAI研究员博文·贝克认为,躲猫猫被选为一个有趣的起点,主要是因为其规则很简单。所有游戏中的代理(Agent,也称智能体,指能自主活动的软件或硬件实体)都被模拟为球形对象,可执行3种类型的操作:导航、抓住并移动物体、锁定对象,且只能由该代理的队友解锁。

????研究人员在模拟的、物理接地的环境中放置了1—3个“躲藏者”和1—3个“寻找者”,房间的边界是静态墙。环境中还包括不同尺寸的可移动箱子和可移动坡道。

????研究人员使用强化学习来训练游戏代理,并遵循简单的躲猫猫规则:隐藏者成功躲过寻找者的追逐,或是寻找者成功找到躲藏者。

????AI如何玩躲猫猫?

????在经过数亿次的游戏后,AI代理经历了几个阶段的策略发展过程。

????在初始阶段,躲藏者(蓝色)和寻找者(红色)通过在空间中移动而不操纵任何物体,制定了非常粗糙的躲避和追逐策略。

????在经历2500万个回合后,游戏变得更加复杂。躲藏者学会了移动和锁定在环境中的箱子和路障,以在自己周围建立堡垒,这样寻找者就永远看不到它们了。不仅如此,他们还制定了协调战略,例如相互传递物体,以加快建造堡垒的进程。

????然而,在游戏进行了7500万回合之后,寻找者发现了一个反策略。他们学会了在躲藏者的要塞旁边移动一个坡道,并用它来爬过墙壁。

????作为回应,躲藏者学会了将坡道移入他们的房间,因此寻找者无法用它来越过墙壁。

????随着环境变得越来越复杂,躲藏者学会了使用细长箱子建造更强大的“堡垒”。虽然OpenAI认为这将是最终的策略,但在游戏进行到3.8亿回合时,寻找者再次成功反击,找出一种方法来跳到一个盒子上并利用动力在它上面“冲浪”,越过墙壁进入堡垒。

????在最后阶段,躲藏者学会在建造堡垒之前锁定所有箱子,以防止“箱子冲浪”。

????研究人员将这些不同策略的演变称为“来自多智能体自动课程的紧急技能进展”。“自动课程”这一术语是今年由DeepMind创造的,适用于多个代理逐渐创造新任务以在特定环境中相互挑战。OpenAI的研究人员认为,这个过程在自然选择方面具有相似之处。

????这项研究为啥很重要?

????鉴于躲猫猫相对简单的目标,通过竞争性自我游戏训练的多个代理学会了使用工具,并采用人类相关技能来获胜。OpenAI认为,这为未来的智能代理开发和部署提供了一个有前景的研究方向。OpenAI正在开源其代码和环境,以鼓励在该领域进一步研究。

????OpenAI的最终目标是构建能够在一个通用系统中执行多项任务的人工通用智能(AGI)。虽然可能会有不同的目标,但OpenAI正在大力投资由大规模计算能力实现的强化学习研究。OpenAI最近与微软签署了一份价值10亿美元的为期10年的计算合同。

????躲猫猫游戏研究也激发了OpenAI,因为随着环境复杂性的增加,游戏中的代理不断地通过新策略自我适应新的挑战。贝克表示:“如果扩展像这样的流程,并将其放入更复杂的环境中,那么你可能会得到足够复杂的代理,以便为我们解决实际任务。”

????挑战在哪里?

????游戏代理有时会表现出令人惊讶的行为。例如,躲藏者试图完全逃离游戏区域,直到研究人员对此施加惩罚。

????其他挑战可能归因于模拟环境设计中的物理缺陷。例如,躲藏者了解到,如果他们在拐角处向墙壁推动斜坡,斜坡将由于某种原因穿过墙壁然后消失。这种“作弊”说明了算法的安全性如何在机器学习中发挥关键作用。研究人员说:“在它发生之前,你永远不会知道。这类系统总是存在缺陷。我们所做的基本上是观察,以便我们可以看到这种奇怪的事情发生,然后试着修复物理缺陷。”

  • 相关阅读
  • 直道超车,量子通信跑在世界前列

      高冷的量子物理和我们的生活有什么关系?   “其实,过去的一百多年,量子力学的发展,所催生的各种技术已经彻底改变了我们的生活。”中国科学技术大学陆朝阳教授告诉科技日报记者。   时钟回拨至三年前...

    时间:09-25
  • 田大新:5G普及后将大幅度提高车联网渗透率

      随着5G商用启动,业界期待这项新技术带给传统行业新变革。比如对汽车行业而言,这将意味着自动驾驶、车联网迎来加速和突破,让整个产业充满想象空间。   “未来智慧交通的发展趋势势必为智能化、网联化,从...

    时间:09-25
  • 项目密集落地 高端制造业成为外商投资重点

      9月24日,记者从2019世界制造业大会成果新闻发布会上获悉,大会期间制造业领域外企签约项目达89个、投资额391亿元。其中先进制造业项目40个、投资额118亿元;智能终端、集成电路、生物医药、新型显示等战略性...

    时间:09-25
  • 创新是建设“数字中国”的主动力 ——访中国工程院院士倪光南

      中国互联网经历了波澜壮阔的开拓历程,取得了举世瞩目的巨大成就,成为全球互联网举足轻重的关键力量。如何评价“数字中国”建设取得的斐然成就,下一步自主创新的发力点又在哪里?记者采访了中国工程院院士...

    时间:09-25
  • 万物互联时代更需筑牢安全防线 ——二〇一九年国家网络安全宣传周现场采访见闻

      日前,以“网络安全为人民,网络安全靠人民”为主题的2019年国家网络安全宣传周在全国31个省、自治区、直辖市统一开展。记者在活动的开幕式、网络安全博览会、网络安全技术高峰论坛以及各分论坛上采访发现,...

    时间:09-25
  • 共享充电宝告别一元时代?

      “共享充电宝涨价啦?”有媒体曝出,充电宝告别一元时代,“部分充电宝8元每小时”的话题昨天在新浪微博已经冲上1.2亿阅读量。   北京青年报记者在北京随机抽选了几个大型商场,对其中店铺投放的共享充电宝...

    时间:09-25
  • 地球“指纹”指引人类探寻下一个家园

      太阳系外是否有生命?寻找这个问题的答案犹如寻觅一座圣杯。   目前,天文学家已发现4000多颗系外行星,研究这些行星的重要目标之一,就是找到另一个适宜人类居住的星球,为未知的将来寻找下一个家园。...

    时间:09-24
  • 部分暗物质由原始黑洞构成?科学家称并不排除这种可能性

      科技日报北京9月23日电 (记者张梦然)包括欧核中心(CERN)科学家在内的一个国际团队,借助超级计算机聚焦大爆炸后瞬间诞生的原始黑洞,再现了光子与氢之间的交互。他们分析后发现,宇宙网是一个由气体和暗...

    时间:09-24
  • 科技部:新型研发机构应对标市场化薪酬

      记者从科技部网站获悉,近日科技部印发了《关于促进新型研发机构发展的指导意见》(下称《意见》)。为深入实施创新驱动发展战略,推动新型研发机构健康有序发展,提升国家创新体系整体效能,该文件提出十八...

    时间:09-23
  • 距今5000年!良渚文物中发现最古老五角星图案考古探秘

      对于现代人,尤其是中国人来说,五角星是最熟悉的多边形了,与此同时五角星在外国也是见惯不惊的图形,现实生活中它的存在似乎也很平常。它可以庄严地出现在许多国家的国旗上,也可以很威严地出现在军人们的...

    时间:09-23
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。