1000 个智能体,在《我的世界》里创造了世界上第一个 AI 文明

2024-09-17 www.dnxtw.com

西部世界即将到来?

作者 | 张勇毅

编辑 | 郑玄

你有没有想过?「完全由 AI 控制世界的运行」会是什么样子?

也许你认为这个想法离我们还有很长的路要走,但实际上「世界上首个 AI」文明诞生了,仍然在一个全年龄的游戏中。

「让 AI 建立自己的世界并运行」事实上,这一概念在大模型的发展过程中并不陌生:特别是在开放的世界游戏中,探索 AI 怎样做出自主决策,一直是一种自主决策 Agent(智能体)研究领域经常提到的发展方向。

这个想法往往成为文学作品的背景设定:在美剧《西部世界》中,出现了这样一个完全由 AI「构建」、以美国西部开拓历史为原型的虚构文明将根据实际情况做出相应的决策。即使有人类的干预,这也完全是由 AI 构成的小社会也能保持正常运转。

这样的想法现在已经被一家人接受了 AI 陪玩公司开发了雏形:9 月 4 日,创业公司 Altera 的创始人 Robert Yang 在社交媒体上发布了一段关于声称的文章「世界上第一个智能体文明」演示视频,并配文:

「人类之所以能登上月球,是因为人类能够完成大规模的合作」「AI 能做同样的事吗?」

截至本文发布时,该视频的观看量已经突破 71 一万次,并获得包括 OpenAI 多方技术大牛的转发与讨论,包括员工。成为业内讨论最多的新话题,Robert 我还表示,我将在9月下旬发表更多的研究论文,披露更多有趣的细节和技术原则。

01、构建新文明

这个所谓的「世界上第一个智能文明」,实际上名为「希德计划」(Project Sid),目的是建立一个由数千人组成的 AI 智能体构建的驱动文明。

从 Robert 从目前世界上发布的视频中可以看出,「居住」根据人类社会的发展模式,建立了自己的社会体系,包括政府、警察、宗教机构,甚至是相应的「宝石」作为一种货币交易系统。

在演示视频中,这些四位数以上的智能主体都被赋予了自己独特的姓名、专业知识和爱好,这在很大程度上决定了他们在这个小社会中的作用,最终让整个生态每个人都生活和工作,保持平衡,共同努力,在抵御怪物入侵和满足生存的前提下,完成基础设施和其他复杂的工作。

在 GPT-4 的加持下,「希德计划」智能体取得了前所未有的突破:他们收集的物品是过去类似实验的五倍,他们还模拟了现实世界中的民主议会和宗教等人类文化特征。

更有趣的是,在智能社会建立民主制度的基础上,开发者插入了智能版本的特朗普和哈里斯,以文档的形式传播了美国两党的主要政治理念,让人类世界的美国选举真正到来之前,智能社会首先进行了模拟选举。

当一个成员在这个社会失踪时,其他智能体验首先讨论和分享现有信息,并迅速得出结论,共同寻找失踪成员,并迅速提出建议「亡羊补牢」的改进措施 —— 增加路边火炬的数量,以降低未来成员失踪的可能性。

这些模拟社会的细节不同于我们以前熟悉的细节 AI 单枪匹马的强劲表现展现了一个高度文明的社会:一支能够在紧急情况下规范成员并快速互助以实现应变的团队。

02、开发团队

实际上,Robert Yang 此前创立的 AI 初创企业 Altera,今年5月推出了一款 AI 陪玩 Agent「Altera Bots」,应用游戏是《我的世界》。

在5月份发布的陪玩机器人中,Altera Bot 已显示出不需要玩家干预,独立玩游戏,在玩家玩游戏遇到瓶颈时出手帮忙。

但这个 AI 如果玩家要求玩家,陪玩不仅仅是完全听从玩家的命令,比如 AI 当玩机器人攻击其他玩家时,机器人会拒绝这样的请求,甚至在玩家在游戏中攻击机器人时做出一定程度的反击。

彼时,这个 AI 玩机器人在一定程度上表现出了自主决策的能力,但此时此刻 AI 建设文明的智慧能力还有很长的路要走。

虽然 Altera Bot 作为一个玩伴机器人,它在当时对话机器人的表现中并不出众,但这家公司是第一个产品 —— 也就是这个“我的世界”AI 陪玩平台发布后,很快就收获了,包括 Google 前 CEO 艾瑞克施密特的投资公司包括 900 融资1万美元。

没有别的理由能迅速收获资本青睐,Altera 不仅包括创始团队 Robert 这样一个拥有耶鲁计算神经科学博士学位的大牛,在创业之前曾是麻省理工学院研究所的负责人,还有很多公开的创始团队来自。 Google X、以斯坦福机器学习研究小组和伯克利命名 AI 科学家加入了研究机构。

除了创始团队,资本可能更重要「陪玩机器人」在表象下,Altera 数字双胞胎领域的巨大潜力;通过完全模拟的人类社会,观察群体在面对重大问题时的选择。

这不是《我的世界》第一次生成 AI 领域作为「开放世界样本」得到应用:2023 五月,英伟达 AI 科学家 Jim Fan 等待团队,已经通过 GPT-4 包装在我的世界里,测试一下 AI 学习技能的效果是基于环境反馈。

Voyager 已首次展示 AI 不需要调整模型参数,可以重用以前学到的技能,实现「终身学习」潜力。但它仍然停留在单个智能体中「升级打怪」之路。

如今,AI 不仅可以在游戏中独立思考,还可以在此基础上完成团队合作 AI 完成了很多看起来复杂的事情「超级工程」,成为可能。

但建设稳定的文明是一项极其复杂的工程:Altera 在希德计划的技术博客文章中,团队在建设世界时面临的主要挑战是如何衡量社会进步的程度和因素:社会进步可以反映在 AI 更富有或更整体 AI 社会越来越强大,但这些都不能从整体上确定 AI 社会处于进步状态。

此外,人类通过自然语言给予它 AI 下达命令时,经常会出现「词不达意」的情况,在 AI 研究团队也经常出现在社会上,特别是在论文中 GPT-4 能力赋予智能身体在传递特定任务信息(如制作镐)时,对传递信息的准确性有很高的要求,否则会随着巨大社会中不同分工的逐层传递而变化,实际结果与最初的指令截然不同。

03、「数字生命」探索世界

在「数字孪生」与「数字生命」在这两个概念流行之前,《我的世界》一直是文明发展过程的优秀载体,其意义甚至超过了游戏本身的内容。让两组「村民」(游戏中的 NPC)在玩家的干涉下,各自发展文明,发展到一定阶段后爆发战争,往往是 YouTube 在《我的世界》主题视频中播放的热门视频数千万。

然而,除了这些情节设置带来的表演效果外,在一个完全由智能主体构建的社会中,它还将根据当前的需要进行思考和整理 AI,如果你在游戏中不断发展,你会触及智慧生活会想到的终极命题:

「我存在的意义是什么?」

在我的世界里,这个「终点」被设计为「收集足够的材料和供应,打造下传送门,打败最终 Boss—— 末影龙」。

这个目标是英伟达 Voyager 时期,AI 可以实现创造一个复杂的 3D 结构的下传送门,但此时仍基于人类提供的信息标记反馈 —— 因为它不仅涉及复杂的建筑,还涉及生存以外更高维度的需求。

在 Robert Yang 事实上,这种演示视频已经涉及到发布的演示视频 AI 成长曲线:一个叫 Olivia 女性智能体,她被设定为工作类型「农夫」,负责为整个社区提供食物。

但是有一天,Olivia 受到社区中冒险家的鼓励,产生了「世界这么大,我想去看看。」想法;然而,在与社区中的其他智能人士讨论后,她意识到向外探索的冒险很重要,但目前的社区也离不开她的工作来喂养所有的成员。

在这个过程中,Olivia 觉醒了作为个人的价值探索,但也意识到了自己的责任。这个高度人性化的过程完全是社会化智慧生活应该表现出来的特征。

从开发团队发表的论文中也可以看出,开发团队想做的可能是另一款游戏《底特律:变人》中想象的场景:未来具有高度自主性的智能主体,可以以极其聪明的能力和理解现有规则并遵守的组织能力融入人类社会,帮助这个社会变得更加高效。同时,解决现有人类社会中人类难以解决的一些社会问题。

在《底特律:变人》中,创作者通过游戏中人类角色汉森的嘴巴,表达了他们将智能身体融入人类社会的最终目标:CyberLife androids are designed to work harmoniously with humans.(模控生命的仿生人原本是设计与人类和谐共事的。)

Altera 希德计划可能是人类在大模型研究领域能够实现的最大、最完美的社会模拟实验,其中智能身体所展示的人性和文明甚至已经到了人类现在会感到羞愧的地步。

当然,有些人看得更远。在原帖发布的评论区,有人看到了这些智能体在文明和人性下隐藏的欲望和冲突:在模拟中,特朗普和哈里斯的智能体被选中,包括「反对堕胎」「增加更多的警察来预防犯罪」这样一个相对有争议的政策。

一个完全由智力组成的文明会重新走上人类走过的道路,还是通过更智能的方式更理想地解决这些问题?

本文来自微信公众号:微信公众号(ID:null),作者:张勇毅

广告声明:文本中包含的外部跳转链接(包括不限于超链接、二维码、密码等形式)用于传递更多信息,节省选择时间。结果仅供参考。计算机系统网络上的所有文章都包含了本声明。

相关阅读