莉莉丝CTO聊UGC编辑器,AIGC大有作为
干货还很多
编者按:作为融合了科技、艺术、文化等元素的复合型内容产品,游戏的科技价值在近年来越来越多的被提及。尤其在今年AIGC大爆发之际,游戏中的硬科技更被赋予了更大的想象空间。
在今天的中国游戏产业年会“游戏再认知”分论坛上,紫龙游戏CTO王琦、腾讯引擎技术中心总监吴羽、本站伏羲实验室AI技术负责人吕唐杰、莉莉丝研发负责人徐小悦、以及中国科学院技术史博士刘毅,就“游戏硬科技的自研与应用”这一主题,展开了充满思辨的圆桌对话。
对于国内厂商和国际大厂间的技术差距,活跃在研发一线的王琦认为,最大的缺口在于我们缺少在顶尖技术下的成规模应用能力。这个缺口不止在技术实现层面,更体现在大规模下的技术管理能力和经验。
而相似的问题也发生在游戏引擎领域。作为游戏技术的集大成者,游戏引擎是每个厂商想要更进一步、创造壁垒的必经之路。在实际探索中,腾讯用技术和工具,将对复合型人才的需求解耦为更易实现的小步快走。
同样在引擎侧发力的厂商还有莉莉丝,CTO徐小悦直言在第一眼见到AIGC时就认为它在UGC领域会大有作为,而莉莉丝也正是选择从UGC切入引擎领域,并推出了“达芬奇编辑器”。就在不久前,由达芬奇衍生出的派对游戏新作《生活派对》开启了首测,而备受期待的UGC能力也有望在游戏的下一测时接入。
整体来看,关于游戏自研,国内厂商们进步显著但仍需更多的时间来培养人才沉淀经验。不过在游戏技术的跨领域应用上,我们则看到了更多的惊喜。
一直以来,腾讯本站都是游戏技术跨领域应用的排头兵。在耳熟能详的数字长城和数字藏经洞之外,腾讯又与南航合作将游戏引擎的高精度渲染应用到了飞行员训练之中,并克服了游戏技术在工业领域中遇到的稳定性和精确性挑战。
如果说腾讯选择“上天”,那本站就选择了“入地”。通过将渲染、AI、远程控制等游戏技术运用到挖机作业中。本站初步解决了在恶劣危险环境下,人员对挖机的远程操控,大大增加了工程安全性,后续也将更广泛的运用在川藏线的建设之中。
可以说,在未来万物互联的超级数字场景下,游戏中的硬科技有望成为众多行业和领域的发展转型基石。而像AIGC、XR等新技术的涌现,也让我们的未来变得更加智能和可期。
以下为圆桌论坛全部分享内容,为方便阅读稍作编辑。
比起技术,差距更多是人才与经验
主持人:今年很多3A大作有着让人印象深刻的技术细节,比如说《荒野大镖客》中的马匹肌肉线条,《美国末日》中极其拟真的麻绳,这些技术的背后是大量的时间和精力投入。基于这一点,目前国内的研发商和世界一流厂商的技术差异主要在哪?
王琦(紫龙游戏CTO):目前国内的游戏产业主要还是集中在手机游戏,我们在资源和计算能力受限情况下的开发能力,在全球是比较领先的,但在最高端的技术应用方面是存在缺陷的。
准确来说,对于技术单点我们是能够在合理的成本下获取到,那么真正的壁垒的是什么?我觉得是在非常高技术领域的成规模应用。
我们研究一个单点技术,形成一个demo其实很容易。下一步的工程化,即在工程里处于可用状态也还不难,组建一个小团队是能做到的。再下一步是如何用高效的方式整合到整个开发流程当中,这就需要大量的能够使用技术和懂技术的人。
对比汽车产业,国内的汽车产业开始是买核心部件来组装,随后开始对一些部件进行国产化,再到全产业链的国产化,我认为游戏产业正处于国产化的过程中。结合我们自己的发展,一开始也是基于Unity和UE引擎做一些上层的开发,然后逐渐需要对引擎进行更深入的定制化。
随着定制化的产生,整个信息的厚度,即参与开发的人员的信息交流的力度就会变得更多。为了维持整个信息系统不限于混沌,传统3A厂商在开发上的技术管理经验就显得尤为重要,它可以令你不断的正向前进。只要保证每天都有一点前进,认认真真做事,我相信整个我们会向汽车产业一样,能够迎来自己全产业链的大发展。
吴羽(腾讯IEG研发效能部引擎技术中心总监):我接着王老师的观点再说两句,游戏引擎是各项游戏技术的集大成者,它是由非常多的游戏喂养出来的,国内还需要时间去积累。
国外一个比较值得我们学习的地方,是工业化的游戏制作流水线。它不仅是技术,还包括工具以及经验。你会发现需要有一个人他既懂美术,又了解整个游戏的制作流程,还要会写底层算法。很显然,这样的人才非常少,整个项目都流转不起来。
而国外发展那么多年了,确实有很多复合型人才,这点我们还要慢慢培养。在此情况下,我们认为除了学习国外经验,还得去打造适合自己的工具技术和流程。因此上述的三个方向需要解耦,毕竟单个领域在国内都能招到很优秀的人才。通过一些工具,把不同角色剥离出来,各司其职再有机的结合。
主持人:现在主流的引擎公司大多来自国外,这会不会让我们的游戏科技发展遇到被阻断的情况?在这个角度下,我们做自研引擎的必要性和意义在哪里?
徐小悦(莉莉丝研发技术负责人):我觉得卡脖子问题是会出现的,同时国外厂商的经历也可以作为参考。他们在早期也是使用商业引擎来做研发,可一旦形成一定规模,几乎所有的大厂都会试图去掌握核心的引擎技术,并进行巨大的投入。
对于游戏引擎,我也很爱把它和汽车产业做对比。它就像汽车发动机,你买一个进口发动机也能造成不错的汽车,但会缺少核心的竞争力和技术壁垒,缺少建造护城河的能力。我相信对于任何一家达到一定规模,且希望在领域内生根的公司,自研引擎都是一件不可避免的事情。
做这件事的路径其实很多,不同公司有自己的方法。比如说腾讯,在我看来应该是一个多点开花的方式,因为它有足够多的资源。那么像莉莉丝,我们是要寻找到一个比较好的切入点,以渐进的方式来积累能力。所以我们选择了UGC,因其对于引擎能力的需求和传统商业引擎有比较大的差异。
主持人:其实我对达芬奇也很好奇,想追问一下,在做达芬奇的过程中有没有遇到一些比较大的挑战和想解决的问题?
徐小悦:我们针对的是业余开发者,他们的专业知识储备是不足的,但又要让他们能够非常容易的去创造游戏、展开协作、共享资源等等。因此,我们所涉及到的技术栈其实是超过了传统游戏引擎的范畴。比如说作为一个编辑器,它还要承担版本管理相关功能,且要足够的好用,这也是一个非常大的挑战。
跨越领域,游戏技术大有可为
主持人:我们知道游戏也是一个非常重要的文化产品,它作为一个新兴的,有强烈冲劲和能量的产业,在超级数字场景以及游戏跨界方面,发生过哪些变化?
刘毅(中国科学院技术史博士):今天坐在这里是有点惶恐的,4位都是技术大咖,我本身不研究技术的迭代,只是从旁观者的角度去看整个技术的发展的脉络。
游戏技术在游戏中的应用,和在其他行业的应用,最本质的区别在哪?首先它的满足点是不一样的,游戏首先是玩,即游戏科技在满足用户的娱乐需求后,其实就已经合格了。
但当它运用到其他领域时,满足点就发生了变化。比如刚才说到的敦煌藏经洞,一毫米的复刻精度非常厉害了,但站在数字孪生或者工业领域,0.01毫米0.001毫米的加工精度比比皆是,这其中的量级的变化对于数字技术的挑战非常之高。
此外,游戏技术在研究领域的更深层次应用是什么?它解决了三个问题,一是过去想做而不能做的实验,比如一些重大社会公共事件的应急反馈、重大自然灾害的一种应急管理等等,现实中你无法模拟这些情况。
第二就是规模太大的实验,比如疫情管控,它不仅仅是武汉一座城市的管理,还包括其他城市以及整个国家在全球舆论下的反馈,它是整个系统的变化,这是现实难以实现的规模和体量。第三很简单就是成本。而游戏引擎的技术迭代,发生于自身的市场需求,同时又对于某个工业领有很好的反馈。正是因为这种双向的互动,是我非常看好游戏科技在未来的跨界应用。
吴羽:我一直从事自研引擎方面的工作,腾讯也在自研引擎上有非常长期的投入,我们是在从0~1在打造一个完全具备自主知识产权的自研引擎。事实上,游戏引擎在国外已经在核电、军事等很多领域中有非常广泛的应用,而国内才刚刚起步。
同时在实际落地中,我们看到工业领域的要求其实是更加苛刻的。举两个简单例子,一是关于稳定性,以游戏帧率为例,一般来说一款游戏能在PC或者主流手机上跑到稳定59.5帧,算是非常好的成绩了。
但我们发现在工业领域,比如说南航飞行训练机的视景系统,它有一个非常大的屏幕。飞行员在训练中即便只是少了一帧都能看出来。同时,它需要每天20个小时运行,不能出现崩溃的情况,稳定性要求更高。因此,我们需要对引擎做非常深刻的改造才能解决这些问题,把游戏技术从娱乐领域应用到更严肃的实业领域。
第二个例子则是准确性,例如在降落过程中,飞行员会去看地面上的指示灯和标线。但这些很小的平行线在渲染时会出现摩尔纹的情况,无法达到想要的训练效果。我们通过非常多的优化,才最终符合工了训练要求。从游戏技术要扩展到其他领域,还是要怀有一颗敬畏之心,是我这两年非常深刻的体会。
主持人:从技术角度来说,AI和游戏技术一直是相伴而生。比如《逆水寒》应该是国内少数实装了非常多实验性AI能力的游戏,所以我也想请本站伏羲实验室的吕老师来跟我们分享一下自己的想法和探索。
吕唐杰(本站伏羲实验室AI技术负责人):伏羲实验室成立于2017年,为什么会在那个时间成立?因为当时AlphaGo的出现给公司高层带来比较大的冲击,觉得这个技术应该能在游戏里产生比较大的影响,所以决定要为未来做准备。
我觉得游戏跟AI,一直是相辅相成的形态。目前大家最耳熟能详的几家公司,在刚开始做技术的时候,都有在游戏方向做研究。比如DeepMind在做AlphaGo前,先在一些特别小的游戏中验证自己的强化学习技术。
而像OpenAI在做大模型之前,做过Dota2的AI机器人。并在非常复杂的游戏环境里,实现了超出当时世界最强职业战队的竞技水平,证明了用深度强化学习技术,可以达到甚至超越人类的能力上限。在验证了技术可能性后,再把技术不断运用到更多场景中。所以我觉得游戏在人工智能的发展里,发挥了非常重要的作用。
另外主持人也提到,AIGC本身有很多优势。一是成本比较低,相比在现实中做技术验证和实验,在游戏这样的虚拟环境里,首先可以并行的起非常多的环境。另外因为引擎可控,我们可以对过程进行加速,提升时间效率。
另外在跨界这块,我们也把技术应用到了更多实体场景中,比如我们有一个挖机机器人的应用场景。我们在了解这个行业时,发现挖机在很多场景下风险性非常高。它在西部的一些矿山、高原场景下,因为山体非常斜,一有不慎操作就会出现事故。
其次就是这些环境本就恶劣,像在高原地区缺氧条件下还要高强度的工作,对人体也是巨大挑战。因此,我们在想能不能让这些挖机师傅,能像玩游戏一样非常轻松的开挖机。
对此,我们做了很多研究,也运用了很多游戏技术。比如说远程的实时渲染,我们可以通过渲染技术做到三维实施重建,让挖机师傅可以实时看到360度的视角转换。另外就是一些人机协作,通过强化学习技术,让AI自动的去做一些操作,降低师傅的操作强度。
主持人:在数字人文领域,我知道腾讯在数字藏经洞、数字长城这类项目中,遇到了不少挑战和阻碍,你们从实际经验出发觉得后续应该怎么样去更好的推进?
吴羽:首先这些项目肯定是站在讲好中国故事大背景下,它的意义是非常大的。过程中其实非常依赖游戏相关技术的提升。腾讯现在做的数字长城,敦煌数字藏经洞、北京中轴线这些项目,其实都大量使用了游戏内容制作的工业化流水线能力。
这些技术进步让我们有可能将莫高窟在内的很多洞窟,真的搬到超级数字场景中。另外像数字长城项目,上线后的访问量远超它此前5年的游客总量,让更多的人可以触达我们的传统文化。此外,运用这样的技术还能对效率提升起到非常大的效果。从2017年,PCG技术在国内游戏圈开始生根发芽,到现在6年过去了,行业中的大规模场景制作效率大约提升了100倍。在之后AI技术加入后,我相信它会有进一步的提升。
然后我们把这个技术用到其他领域,比如刚才提到的飞行训练,100倍的效率提升会是非常恐怖的一件事。另外我们还可以把中国的250多个机场都进行数字重建,进行更贴近真实的训练,也可以切实提升民航安全。
畅想未来,技术发展引领变革浪潮
主持人:最后一个话题是来畅想一下未来,面对各类新技术的出现,各位会不会觉得很焦虑?还是说觉得站在时代变化的档口,觉得很兴奋?目前大家有看到的新技术中,哪些给你们留下更加深刻的印象?又更看好哪一项技术?
王琦:我在看到苹果的Vision PRO后,第二天就和公司管理层分享了自己的兴奋。因为我投身这个行业的原动力,就是要追求不同的游戏体验,而它能够带来游戏体验的巨大想象空间。结合大语言模型和AIGC,我们是不是有能力创造能够让人忘掉自己现实存在的元宇宙世界,这背后最重要的两个门槛是什么?
一是单体交互中NPC对你的说服力,伏羲他们在《逆水寒》里做了不少这样的工作。二是整个世界资源体量的问题,为了创造这样大的数字世界,成本是非常难以接受的。但在可预见的将来以及目前可见的技术发展趋势,这两点都会被AI极大地解决。
我觉得可能在未来十年内,我们结合Vision PRO这种设备,将会出现像《西部世界》这样的产品,得到此前完全无法想象的体验,仅是想象就让人非常兴奋。
吴羽:对于刚才提到的所有技术进步,其实我都是非常开心的,因为它们能让游戏引擎变得更加好用,或者能触达更多的人。另外因为游戏引擎想要提供好的画面质量,非常依赖内容。我个人很看好PCG加上AIGC这条方向的发展。
当然我的视角可能不一定对,个人感觉这也不能解决所有的问题。对于AI,我认为它是对信息的压缩和解压的过程。
举个例子来说,假设我对训练了场景生成的模型说“生成一片森林”,其实隐含很多意思在里面。相当于让AI根据学习到的知识去生成森林,这些知识可能包括颜色、材质、风格等等,他可以产出一个让你惊讶的东西。
但在专业制作领域,比如说要构建一个城市或在游戏中定制场景,需要有艺术创意体现其中,就需要专业的美术工作工作者提供非常强的控制力。这两者就出现一些矛盾,我无法通过不断的随机来随到我刚好要的场景,可能要用Lora或者是Control的方式去对它进行控制。
我们发现如果一个艺术家想要非常精确的产出一个风格创意化的资产,他需要精确的控制好所有变量,使得输入的语句会变得很长。甚至长度可能和他在三维软件中直接编写是差不多的,或者是成正比的。
所以我们现在在探索一个方式,用PCG去描述我大概想做一件什么样的事情,让它来把这个“咒语”拼出来,然后再让AI去生成。这样一来,AI就是我在Generation上的一个节点,最后通过一张网络把这一个个节点连在一起。通过这样的方式,它能够更快的去创造更加丰富的可定制的,而且带有艺术创造的专业化的场景,也可以降低整体的门槛。
吕唐杰:我可以讲一下我们实际中确实遇到的一些问题。AI生成的美术效果在非专业人士看来,是非常不错的。但我们在实际落地过程中也确实发现,真正想要达游戏开发所需要的美术级别,其实还是有一定的挑战。
比如刚才吴老师提到的可控性,美术人员在创作一个美术资产的时候,他脑子里是有一个大概想法的,不是凭空靠几个文字就能把它给描述清楚的,所以这种生产过程中的可控性,确实会有一些挑战。
举个三视图的例子,我们发现三视图对可控性的要求是非常高的。当你给到一个正视图,让AI来生成侧视图和背视图,就需要非常强的逻辑性。首先物体的形状得是一模一样,不能正面和背面看上去是不同的。另外色彩也必须得是一致的,前面是大红反过来是浅红,这感觉也不对。
整体来说,真想要达到像专业美术标准,中间有很多工作要去研究和解决,并不是大家想象中把AI技术拿给美术用,他的工作效率就大大提升了。
另外吴老师提到的PCG和AIGC的结合,我们也是有深刻体会。比如在游戏开发过程中做一些三D的模型资产,我们也不是直接上AIGC的,而是跟PCG一起结合。先让PCG生成一些可控性的原子组件,然后利用AIGC更强的审美能力,来判断出这个组件是不是更符合使用者给到的参照图片,或者说使用者想要的美感。
PCG比较强的是它能快速生成可控性组件,并且能大批量的生成。但判断这个东西好或不好,是目前AIGC比较擅长的地方,所以我们在这种场景下就会去做很多结合。
徐小悦:对我来说,当我第一次看到今年AIGC技术爆发的时候,第一个反应就是这个东西在UGC领域应该是大有可为的。因为我们遇到的最核心的问题,其实在于如何降低门槛和如何解决简单重复的劳动这件事上。
前面两位老师提到的关于它在专业能力上的一些不足之处,由于不同的应用领域,会有不同倾向的能力需求,在UGC这里会影响更小。在这种情况下,我认为UGC领域正好是一个可以很好发挥AIGC能力的天然场景,这也是我觉得未来我们可以发进行深入研究发力的地方。
另外谈到所谓的焦虑问题,其实我是有相当大的焦虑。坦白来说,因为我本人是游戏引擎出身,看到了这样会对游戏未来发展有深远影响的新技术的涌现,而且还是自己以前并不熟悉的领域,就会产生一些自己要被时代淘汰的紧迫感。
但与此同时,这种紧迫感其实也是我们技术人的驱动力。活到老学到老,一定要保持自己对于新技术的热情,和拥抱新技术的态度,才能够使我们在这个时代浪潮中不会被淘汰。
刘毅:刚才几位也都讲了人工智能的事,当前的这种飞速发展确实很非常令人激动。说它是一个新的种族即将诞生,应该也是没有什么疑问的。
另一方面我想回到刚才王琦总讲的XR领域,我觉得AR也许是一种革命性的代际性的变化,无论是对于游戏而言,还是对于整个人类社会而言。
从伽利略到牛顿到爱因斯坦,都觉得这个世界是数字的,解释了这个世界的物理学基础是数学。而如今我们的计算机,底层逻辑也是数学0和1的二进制。在这个维度上,现实世界和数字世界是统一的。
如果从生产力的角度来说,人类到现在经历了农业、工业和数字三次革命。但从交互的角度来说,人类只有两次革命。第一次是单线的交互,第二次就是现在XR代表的双线交互。
单线交互就是我们现实中的人,和现实中的人或事物之间的交互。数字世界中,就是我们作为一个用户,与数字世界中的人或事物交互。但AR的出现让现实中的人,可以和数字世界中的人或事物第一次实现跨越边界的交互。这是以前我们认为绝对不可能跨越的边界。这对于整个世界发展所带来的冲击,都是前所未有的。
尽管AR现在还面临很多问题,比如说显示材质、延迟等等。包括苹果的Vision Pro我体验后也觉得它离我们想象中的那种状态还有很远。但我始终看好这个方向,因为它带给人类的变化确实是我们这几千年历史中从没遇见过的。
主持人:我们这次的圆桌信息量可以说非常大,希望大家都有所收获,然后也希望我们明年有机会可以再见。
*爆料丨合作丨招聘:点击或戳微信号 luoxuanwan111