简介:游戏公司
在24年前上映的《黑客帝国》中,救世主Neo对抗了一个由人工智能程序控制的世界,人们第一次看到了AI技术带来的震撼。
在一些竞技领域,AI已经达到甚至超过了人类多年前的最高水平。最近一年,生成式AI在绘画、文字、代码等创意领域的表现越来越成熟,OpenAI的ChatGPT更是将这种趋势推上了舆论的风口浪尖。最新消息传出,微软正在考虑向OpenAI投资
100亿美元。而AIGC在游戏领域的进步也备受瞩目。投资公司a16z最近发表了一篇研究文章《游戏中的AIGC革命》,认为游戏将是所有娱乐类别中最具影响力的生成式
AI领域。据其团队称,业界多年来一直在探索AIGC的游戏情节生成。但之前的预览版发布基本都是视频演示,用户只能观看体验。他们这次发布的技术预览版已经可以让用户体验了。目前支持玩家在故事中扮演角色,随意用自然语言与NPC互动。AI会实时提供互动台词和剧情推进,实现游戏剧情千人一面的个性化体验。
很快,在下一个版本的更新中,在线用户将上传故事脚本供AI学习,用户可以选择任何角色与其他AI角色进行互动。从长远来看,他们还将专注于推动AI生成的剧情和游戏画面的结合。
赛博制造公司(Cyber Manufacturing Co .)除了刚刚发布技术预告的AIGC引擎量子引擎(Quantum Engine)之外,还有由虚幻引擎unreal engine 5)驱动的元概念项目GAMA(Alibaba),其创始人是人工智能领域的连续创业者吕成杰西(Lv Cheng Jesse)。
在他团队的帮助下,我们用中文体验了AI在实时游戏故事生成中的交互,也提前测试了用户自主上传故事脚本后AI与我们交互的感受。
次世代游戏的体验之旅
进入quantum-engine.ai的网站后,会有几分钟的故事背景介绍。在某些网络环境下,可以访问网站,但可能无法体验AI的交互部分。
如果我们用中文交谈,NPC会用中文回应,如果我们用英语或其他语言交谈,NPC也会用相应的语言互动。
刚开始互动时,我已经忘记了墨菲斯这个角色,所以问了一堆他是谁,要干啥之类的问题。他的回答成功让我想起了故事剧情,墨菲斯是我的上级,在故事设定里,它的角色任务是要启发我反抗机器世界的控制。所以无论我的表达多么古怪,它总是能很好的应对,而且会有意无意地会把对话拉回到故事的剧情线上。这一点挺让人吃惊的,NPC 有推进剧情的意识,它会想尽办法去实现它的角色目的。 刚开始互动的时候,我已经忘了墨菲斯这个角色,所以问了很多他是谁,想做什么的问题。他回答的成功让我想起了这个故事。莫斐斯是我的上司。在故事设定中,他的作用是激励我反抗机器世界的控制。所以不管我的表情有多奇怪,它总能很好的回应,会有意无意的把对话拉回故事的情节线。这是相当令人惊讶的。NPC有推动剧情发展的意识,它会尽力达到自己的角色目的。
我们也是突发奇想,问了一些无聊的问题,类似于让他送我们墨镜。从它的回答可以看出,它记得这些墨镜是这个NPC角色的象征,不能给我任何东西——作为一个人,哪怕是一个机器人,都是有底线的。底线是NPC会坚持输出与故事和人物相关的内容,而不是给你一些全世界都不相关的答案。
但类似于ChatGPT带来的震撼体验,量子引擎拥有多轮对话的能力,合理的线条和交互表达的逻辑,丝毫不逊色于真正的游戏策划人为NPC所做的设计。这项技术对于游戏开发来说可能是划时代的,AIGC的效率是无法和人力资源相比的。a16z在上述文章中预言,AIGC在游戏领域的应用,将打破游戏开发中“成本、质量、速度”不可能的三位一体。
在它团队的帮助下,我们提前体验了下一个更新版本中“用户自主上传故事”的功能。AI用户在学习完故事和角色设定后,可以自由选择任意角色与其他角色对话,体验全开放式的故事互动。
我们试着让艾学习后妃在皇宫滴血订亲的故事,然后播放与皇后的对话。
在体验了AI实时生成的游戏剧情互动后,我们有一个无法回避的疑问。是语音版的ChatGPT吗?我们也把这个疑问抛给了量子引擎团队,他们回复说:
Quantum Engine利用低级OpenAI APIs和开源模型,由Cyber Manufacture Co .训练和微调,以实现高度上下文相关的基于文本的多模态(语音+文本+ 3D模型)和。多语言(如英语、法语、中文、日语、西班牙语)理解场景中的用户意图、角色间交互和环境响应。在此基础上,Quantum Engine包含一个高度可扩展的流编排器,可调度对大型语言模型API的调用,并将原始文本输出转换为结构化数据(音频文本到语音、3d点云、虚幻引擎图元、电影剧本场景),构成最终用户体验。其结果是好莱坞标准的自我创作脚本,能够以接近实时的方式与用户交互,能够保留过去交互的记忆,并在坚持角色和情节的同时响应正常和异常用户请求。
可以解读的关键信息是:
他们使用过OpenAI定制的API接口,在多轮体验中类似于GPT3.5,所以在对话体验上类似于ChatGPT
除了OpenAI,他们还针对游戏交互的垂直场景做了向上并行的技术开发,比如语音识别,又比如把角色限定在故事里,坚持输出角色的目的等等。
目前与用户实时交互的内容会自动转换成标准的好莱坞剧本格式,这是为下一个游戏画面组合做准备。
这份量子引擎的技术预告向我们展示了AIGC在游戏中的探索前进了一步,生成“无限”和“合理”故事的能力已经基本实现,但如果继续发展下去,其商业化前景会如何?
AIGC如何在游戏行业淘金?
最近一轮的AIGC热引起了关注,一篇重要的文章对此有所贡献。红杉资本和GPT-3(AI模型)的两位合伙人共同撰写了《生成式AI:一个创造性的新世界》。
本文将AI分为传统的“分析型AI”和“生成型AI”。前者常用于内容推荐算法中,分析已有事物;后者是用来创造和产生新事物的。AI画图,AI写代码,以及上面提到的AI实时游戏故事生成,都是生存AI的技术成果。
本文认为,在目前的市场阶段,平台层已经开始巩固,模型继续变得更好、更快、更便宜,模型的使用趋于免费和开源。应用层的创造力爆发的时机已经成熟,一个生殖式AI的杀手级应用正在孕育。
文章认为,“就像移动通信通过GPS、摄像头和便携式连接等新功能催生了新类型的应用一样,我们预计这些大型模型将刺激新一波生成式AI应用的诞生。就像十年前移动通信的拐点为少数杀手级应用创造了市场空白一样,我们期待杀手级应用也会出现在生成式AI中。如今,竞争正如火如荼。”
A16z认为,生成式AI在游戏行业的商业化前景首先体现在成本降低上。例如,游戏美工可以在几个小时内生成高质量的图片。在过去,手工绘画可能需要几个星期才能完成。更具革命性的是,AI可以通过学习艺术家的风格进行迭代创作,实时生成无穷无尽的变体图片。
它列出了一把美元2,一个耗资超过5亿美元的游戏。它花了八年时间开发,拥有1000多个NPC角色。每个NPC都有自己的个性、艺术作品和配音演员。在一个接近30平方英里的世界里,它有100多项任务。
通过量子引擎的技术预览,我们似乎看到这些成本正在迅速消失。A16z还认为,游戏制作中涉及的每一项资产都会有一个生成的AI模型,内容的成本在某些情况下会降低到零。
AIGC国内玩家也证实了这一趋势。上市游戏公司昆仑万伟CEO韩方近日表示,AIGC与游戏的碰撞将首先优化美术费用,视觉效果更好,成本更低。
韩方还指出,游戏上线后,可以通过AIGC动态生成剧情、地图和关卡,玩家可以享受自己独特的剧情和角色。一款游戏可以成就千人千面,NPC不再是被简单规则束缚的玩偶。它可以对玩家的动作做出自己的反应,游戏产品的可玩性会大大提高。所以AIGC的游戏体验会有很大提升,市场规模会挤压其他娱乐形式的空。
其描述已经在量子引擎的技术预告中得到证实,NPC对玩家动作的反应和故事体验都是千人千面。这项技术的速度似乎比红杉资本的预测还要快。
Jasper目前正在AIGC+文本领域运行,预计去年的收入将达到6000万美元,估值为15亿美元。而一批AIGC+影像领域的创业公司也开始具备规模化营收的能力。随着AIGC在视频和3D领域的进一步发展,游戏行业正迎来一波翻天覆地的技术变革。
根据量子引擎团队的策划,此次发布的技术预告是其整体策划三分之一的成果,接下来还有两个关键步骤,一是AI实时互动剧情与游戏画面的结合,二是技术最终包装成可运营游戏。他们相信这款游戏最终会成为AIGC方向的杀手级应用。
看到这里,相信很多人会想,最后的游戏会是什么样子?会不会和《黑客帝国》《西部世界》《Ready Player One》等很多科幻片描述的场景一样?到那时,游戏和现实的界限会消失吗?
这当然是量子引擎团队需要思考的问题之一。在系统测试中,他们经常随机与AI进行交互,其中一个经常被提及的问题是:这个世界是真实的吗?
PS:转载自机器之心