首页  »  财经  »  财经要闻

大模型“玩”《黑神话:悟空》比人类强吗

2024-10-21 08:57:00

来源:科技日报

原标题:大模型“玩”《黑神话:悟空》 比人类强吗

人工智能大模型下围棋已不是新鲜事,玩电脑游戏水平如何?不久前,淘天集团未来生活实验室算法工程师,尝试利用多模态大模型体验国产电脑游戏《黑神话:悟空》,探索大模型在特定场景中的能力边界,取得令人惊喜的效果。相关研究成果已上线论文预印本网站arXiv。

《黑神话:悟空》是典型的动作角色扮演类游戏。在当前大模型研究领域,有不少研究者选择将该类游戏作为研究平台,采用纯视觉输入、复杂动作输出的模式,测试大模型在特定场景下的性能表现。其中,纯视觉输入是指模型仅通过理解和分析游戏截图进行决策,而复杂动作输出则需要模型生成并执行复杂而连续的动作,如战斗场景中的精确操作。

想要让多模态大模型控制游戏角色,要克服两大困难。一是直接视觉输入的挑战。由于大模型所需的环境数据不一定能通过游戏API(应用程序编程接口)获取,因此对于那些需要深入理解游戏界面的大型游戏而言,学习从视觉输入中进行推理是一种更直接的策略,这给大模型带来不小挑战。二是面向动作任务的困难。在动作类游戏中,基于强化学习的框架仍然占主导地位,但在特定任务上需要大量训练时间,迁移到其他任务上泛化能力较差,表现往往不佳。

为突破上述瓶颈,在此次研究中,技术团队提出了一个名为VARP Agent(视觉动作角色扮演智能体)的新框架。它直接以游戏截图为输入,通过一组多模态大模型的推理,最终生成可以直接操作游戏角色的代码,每个动作都是由各种原子命令组合而成的序列。这些原子命令包括轻攻击、躲避、重攻击、恢复血量等。同时,该框架包含三个库:情境库、动作库和人类引导库。这些库可以被检索和更新,以存储用于自我学习和人类指导的密集知识。

技术团队定义了10个基本任务和2个挑战任务,其中75%的任务发生在战斗场景中。对于战斗任务,如果玩家角色击败了敌人,则任务成功;如果玩家角色被敌人击败,则任务失败。研究结果显示,该框架在基本任务和简单到中等难度的战斗中,胜率高达90%,但在面对高难度任务时,表现相对较差。总体来看,其整体水平仍不如高水平人类玩家,但研究成果可为设计应对更广泛挑战、更复杂的智能体提供参考。

  • 相关阅读
  • 沃尔沃EM90护航2024金融街论坛年会

    原标题:以安全健康诠释豪华基调,沃尔沃EM90护航2024金融街论坛年会与嘉宾共赴年度之约,沃尔沃汽车助力国际金融盛会。2024金融街论坛年会于10月18日至20日在北京举办,年会主题为“信任和信心——共商金融开放...

    时间:10-21
  • 黄淮海地区秋粮收获已过八成 秋种工作加快推进

    人民网北京10月21日电 (记者李栋)农业农村部最新农情调度显示,目前,黄淮海地区秋粮收获已过八成,秋种工作加快推进。眼下,安徽省合肥市肥东县的百万亩水稻陆续成熟,种粮农民正抓住晴好天气,抢收秋粮,确保颗粒归仓...

    时间:10-21
  • 2024年第三次LPR调整落地 下调0.25个百分点

    人民网北京10月21日电 (记者黄盛)今日,中国人民银行授权全国银行间同业拆借中心公布,2024年10月21日贷款市场报价利率(LPR)为:1年期LPR为3.1%,5年期以上LPR为3.6%。以上LPR在下一次发布LPR之前有效。这意味着10月...

    时间:10-21
  • LPR下调!1年期LPR3.1% 5年期以上LPR3.6%

    人民网北京10月21日电 (记者罗知之)据中国人民银行官网消息,2024年10月21日贷款市场报价利率(LPR)为:1年期LPR为3.1%,5年期以上LPR为3.6%。以上LPR在下一次发布LPR之前有效。2024年9月20日贷款市场报价利率(LPR)为...

    时间:10-21
  • 赏秋正当时 文旅市场凸显消费新活力

    一年好景君须记,最是橙黄橘绿时……10月中下旬,气温渐凉、秋意正浓,多地秋景进入最佳观赏期。不少消费者以多种方式出游,饱览大自然美景,体验各地赏秋活动,品味各地特色美食,彰显文旅市场的消费新活力。10月19日...

    时间:10-21
  • 三季度国家铁路累计发送货物超10亿吨

    人民网北京10月21日电 (记者王连香)记者从中国国家铁路集团有限公司(下称国铁集团)获悉,三季度,铁路货运呈现量质齐升的良好态势,国家铁路累计发送货物10.04亿吨,同比增长3.8%,创单季度货物发送量历史新高,铁路现代...

    时间:10-21
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。