大模型下一步在哪里?王小川、杨植麟等给出回答

作者 | 刘宝丹

编辑 | 周智宇

AI大模型是正在进行的新一轮技术革命,它最终能否通向AGI,在技术研发和商业落地之间该如何权衡,这是当下需要厘清的核心议题。

6月14日,在2024北京智源大会上,百川智能CEO王小川、智谱AI CEO张鹏、月之暗面CEO杨植麟、面壁智能CEO李大海等给出了最新的思考和判断。从理论研究层面来看,业内的共识是大模型可以通向AGI。

杨植麟认为,大模型是第一性原理,需要不断提升模型的规模,它本质上是一个压缩,但这个压缩可以产生智能,随着不断规模化这个模型,不断做更好的压缩,它能产生越来越多的智能。

张鹏认为,目前,大模型在很有效地发挥作用,Scaling Law还在往前推进。李大海也认为,大模型一定是通往AGI这个方向上当前所有技术里能走得最远的。

不过,大模型是否是AGI的唯一答案,目前还很难说。

张鹏表示,大模型是不是能够帮助我们推到AGI顶峰上去,现在找不到一个确切的答案。李大海也表示,大模型能不能直接达到,现在还有很多未知因素。

可以确定的是,大模型技术正在进行快速迭代,而随着技术能力的提高,大模型面临的挑战也越来越大。

杨植麟认为,Scaling Law会持续演进,只是在这个过程中要Skill的方法可能会发生很大的变化。

在杨植麟看来,最大的挑战是数据,在数据没有那么多的领域,或者假设最后要做出来一个比人类更好的AI,可能根本不存在这样的数据,现在所有的数据都是人产生的,最大的问题是怎么解决稀缺甚至不存在的数据。

李大海认为,现在的大模型作为知识压缩,主要是在处理人的大脑系统1的工作。(来自《思考快与慢》,系统1是一种快速、直觉、自动的思维方式,系统2是一种缓慢、逻辑、努力的思维方式。)系统2的能力是未来大模型通过agent技术外部化或者把它内化为自己的能力,这是需要大家去探索的。

王小川认为,今天我们把语言放到大模型里,变成了数学,语言在符号主义和连接主义之间产生了突破,再往后走,还必须有范式改变。

他的结论是,以现在公开的Scaling Law,还做不到AGI。“Scaling Law之外还有范式的变化,比如数据、算法、算力,不只是去简单地变成压缩模式,走出这个体系,才有机会走向AGI。”

在大模型技术演进的同时,创业公司也在摸索落地应用和场景,大模型价格战就是这种心理的一个反映。

“价格战对中国发展大模型非常特别,我是积极看待这个事情。”王小川认为,价格战可以让更多公司和人用上大模型,使得大模型在中国有个迅速的普及。此外,价格战之后,很多企业退回来成为大模型的用户,减少资源的浪费。

张鹏也认为,当有一天AI大模型能力变成像水、电这样的基础能力时,企业会拥有更好的发展空间和态势。

李大海认为,价格战多少有一些营销成分在,但是未来大模型价格一定会比现在还要低,而且大家都有利润,这才是健康的方式,才能让千行百业的应用往下落地。

对创业者来说,AGI是愿景,ROI是企业生存的前提,从商业模式上验证大模型的能力同样重要。

杨植麟认为,改变商业模式本身或者ROI很重要的方式,还是要看大模型的成本和产生的实际价值。

他判断,有三个时间点很重要,一是推理算力显著超过训练算力;二是,从C端的角度来说,推理成本可能会显著低于获客成本;三是,AI本身做的事情超过人做的事情,会产生新的商业模式。

“它可能不是像今天说的在B端用API做价格战,可能是一个普惠的AI,同时根据它产生的价值从这里面去分层产生的商业模式。”杨植麟如是表示。

纵观技术发展的历史,很少有一个技术像AI大模型一样,技术迭代和商业模式几乎同时推进,这也意味着,技术带来的商业化时间窗口转瞬即逝,竞争难度可想而知。

一场前所未有的基于动态大模型技术的商业之争将愈演愈烈。