李开复谈大模型价格战:推理成本将每年降10倍,但疯狂降价是双输
21世纪经济报道记者白杨 北京报道
市场久违的价格战,正在大模型领域上演。
5月21日上午,阿里云宣布通义千问大模型降价,其中Qwen-Max模型价格降至0.04元/千tokens,降幅达67%,而主力模型Qwen-Long的价格降至0.0005元/千tokens,降幅达97%。
降价后,通义千问大模型的最低价格已经达到1元200万tokens。
当天下午,百度云采取了更激进的策略,直接宣布文心大模型两个主力模型(ERNIE Speed和ERNIE Lite)将全面免费。这也意味着大模型迈入了免费时代。
在此之前,率先打响价格战的是字节跳动旗下的火山引擎。5月15日,火山引擎发布豆包大模型,并宣布豆包通用模型pro-32k在企业市场的定价为0.0008元/千 tokens,相当于1元125万tokens,号称比行业便宜99.3%。
推理成本将一年降10倍
对于这一轮大模型降价,零一万物CEO 李开复向21世纪经济报道表示,未来整个行业的推理成本每年降低10倍是可以期待的,而且这个趋势是必然的。对于行业来说,现在模型的API调用还是非常非常低的比例,如果推理成本一年降低10倍那就有更多的人可以用上大模型,这是非常利好的消息。
然而,对于激烈的价格战,李开复指出,类似于ofo的疯狂降价是一种双输的策略。他认为大模型公司应该不会这么不理智,因为技术还是最重要的,如果技术不达标,仅仅依靠赔钱做生意是不可持续的,零一万物也绝对不会跟这样的定价来做对标。
据记者了解,零一万物最新发布的Yi-Large模型的定价是20元100万tokens。李开复称,“我们现在还没有调整价格的打算,Yi-Large上线后的反馈是非常正面的,也有很多忠诚的爱好者已经加入,我们先服务好他们”。
不过,李开复也坦言,“如果以后中国大模型市场就是这么卷,大家宁可赔光通输也不让你赢,那我们就走外国市场”。
谈到零一万物的商业化策略,李开复表示,“我们也在走企业级方向,但是初步用户会在国外”。他认为,国外用户的付费意愿和金额远高于国内,因此尽管零一万物也非常希望服务国内企业,但是按照现在国内TOB卷的情况,我们可能做一单赔一单,这种情况在AI1.0时代看的太多,所以零一万物将坚决不做。
差距从7-10年缩短至6个月
过去一年多,中国大模型一路狂奔,并取得了诸多进展。
“现在如果用国际最好的大模型和国内最好的大模型相比,那还是有一定的差距。但同时要考虑的是,比如谷歌团队是2000人,OpenAI是1000人,而像零一万物把模型加infrastructure团队加起来也不到100人,更不用说使用的GPU算力不到他们十分之一,模型尺寸也不到他们的十分之一了”。李开复说。
所以从效率上来讲,中国大模型的已经远远超过国际顶尖大模型。李开复也提出,“一年前我们落后OpenAI跟谷歌开始做大模型研发的时间点有7到10年,那现在我们跟他们的差距只有6个月左右。”
据零一万物披露,在LMSYS盲测竞技场最新排名中,零一万物的Yi-Large总榜排名世界模型第七,中国大模型中第一,已经超过Llama-3-70B、Claude 3 Sonnet。
“我们发布的模型在今年5月的时候,可以打败去年11月之前的任何模型,这也是落后6个月差距的由来”。李开复说,但在其看来,这6个月的差距也不是很大,因为中国在以一个不可思议的超级速度进行追赶。
比如在算力方面,国外厂商确实有更大的优势,但是,中国厂商能够把同样的一张GPU挤出更多价值来,这是中国厂商能够达到现在水平的重要理由。
另外在模型优化方面,不只是纯粹的科技和算法问题,还涉及数据配比、优化训练等各种方面的技术,在这些方面,中国厂商也不输于美国。
“我在写《AI·未来 》这本书时提到,美国在做突破性科研方面,全世界没有对手。但是在同一本书里我也提到,中国人的聪明、勤奋、努力是不容忽视的。后发有后发的优势,美国的创造性,我们有很多学习的地方,但是比执行力,比做产品,我们强于美国公司”。李开复说。