李彦宏重申文心大模型不开源:闭源模型能力会持续领先丨GAI进化论⑨
21世纪经济报道记者杨清清 北京报道
针对持续火热的AI大模型行业,百度公司董事长兼CEO李彦宏再度发声。
近日,李彦宏的一场内部讲话流出,涉及对大模型开源与闭源的路线选择、AI创业者应专注模型还是应用等焦点话题。
本次内部讲话流出的时间节点,恰好是2024百度Create AI开发者大会前夕。
在4月16日即将举办的大会上,李彦宏将发表2024年首场公开演讲,主题为“人人都是创造者”。因此,本次内部讲话的曝光,无疑是大会演讲内容的预热,亦可一窥百度和李彦宏今年大模型布局方面的态度。
“一年前文心刚刚发布的时候,我们内部是有过非常激烈的讨论的,最后当然大家也知道这个结果,我们的决定是不开源。”谈及开源闭源之争,李彦宏直言道,一方面市场上开源模型众多,不缺百度一家;另一方面,闭源模型能力更优,且具备真正的商业模式及成本优势。
至于李彦宏此前多次谈到的AI创业者话题,他再度重申了自己的立场。
在他看来,对于AI模型创业者而言,“双轮驱动”并非好的模式,既做模型又做应用会分散精力,“创业者真正的优势应该是在某一个领域的知识、数据。”
同时,李彦宏强调,基础模型不会通吃AI应用。“外界担心如果用了文心或者闭源模型,做得好了它就抄你,就把你的饭吃掉了,实际上这种担心也是没有任何道理的。”
模型开闭源之争
自AI大模型火爆之后,行业内也出现了开源、闭源之争。
所谓大模型的开源与否,是指模型的源代码和训练数据是否公开。诸如OpenAI的GPT4属于典型的闭源模型,其源代码和训练数据不公开,只有OpenAI自己才能进行代码数据的使用和修改。
目前在市面上,开源大模型并不鲜见。2023年7月,Meta发布开源大模型LLaMA2,并宣布可免费用于研究及商业,从而引发了业界的广泛关注。而就在上个月,马斯克的AI初创企业xAI正式发布大模型Grok-1,并以3140亿参数量成为当前市面上最大的开源大预言模型。
除此之外,包括被视为“欧洲版OpenAI”的Mistral AI、阿里巴巴的通义千问等企业,均选择了开源路线。根据《中国人工智能大模型地图研究报告》,截至2023年5月28日,我国大模型数量已达79个,超半数已开源,如清华大学的ChatGLM-6B、复旦大学的MOSS。
不过,李彦宏则给开源大模型泼了冷水,“我们的决定是不开源。”
李彦宏透露,选择模型闭源的背后,经过了激烈讨论与深思熟虑。一方面,当前市面上拥有众多开源大模型,“这个市场上不缺我们一家开源的模型。我们开源还得自己去维护一套开源的版本,这是不划算的。”
除此之外,李彦宏认为,闭源模型在能力上会持续领先。在他看来,模型开源的意义其实不是很大,“这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用,它没有经过大算力的验证。”
同时,有别于软件开源,模型开源并不能实现“众人拾柴火焰高”的局面,大模型的主导开发者依然是模型所属的企业,并非真正由参与各方协同开发的产品。
“就模型效果来看,闭源模型一定是比开源模型要好的。”一位大模型从业人士告诉21世纪经济报道记者,“闭源模型要想实现产品化和商业闭环,这就对模型效果本身提出了更高的要求。”
闭源更具商业性
目前,闭源模型具备较为清晰的商业模式。李彦宏也提到,相较于开源模型而言,闭源模型“是能够赚到钱的”。
事实上,闭源大模型具备较为清晰的报价体系。如果是直接调用大模型能力,通常会衡量千token的费用。比如,GPT 3.5-turbo的收费标准是0.002美元/千tokens,文心大模型ERNIE-4.0-8K的收费标准为0.12元/千tokens。
除了按调用收费外,也有一些闭源大模型提供私有化服务。如智谱提供云端与本地私有化服务,不同产品的报价从每年25万元到3960万元不等。
在李彦宏看来,在具备自身造血能力的基础上,闭源模型也就更具备聚集算力、吸纳人才的能力。百度2023年财报显示,2023年公司总营收达1345.98亿元,归属于百度公司的净利润为287亿元,同比增速达39%。彼时李彦宏透露,百度已经从文心一言中获得增量收入,预计2024年相关增量收入将增长至数十亿元。
需要注意的是,除了对于企业而言,选择模型闭源更有希望跑通商业模式之外,针对用户,闭源模型也具备自身的特点。
李彦宏认为,有别于传统观念所认为的开源免费、具备成本优势的思路,闭源模型更具备成本优势。“只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的,反过来,同等参数的情况下,闭源模型的能力也是更强的。”
同时,李彦宏还强调,通过大模型降维训练出的各式各样的小模型效果更佳,这也会导致闭源模型在训练成本及效率上更具优势。
有行业人士向21世纪经济报道记者指出,企业在使用开源大模型时确实需要考虑二次开发成本,因此也对企业自身的技术能力要求更高,需要具备自然语言处理等专业能力。相较之下,闭源大模型会提供相对完整的工具包,通过调用接口即可获得相关技术能力。
“不过从其他角度而言,开源大模型确实能够更快推动技术的发展,促进整个AI生态的发展和繁荣,也更容易被个性化定制和适应不同的应用场景,”前述行业人士指出。
因此,对于开发者和用户而言,考虑使用开源模型或是闭源模型,通常需要结合自身预算进行成本综合考虑。通常而言,开源模型更适用于研究者和拥有二次开发专业能力的中小开发者,闭源模型则更商业化,适用于普通用户。
AI创业者无需“双轮驱动”
除了开闭源模型路线之外,李彦宏本次同样喊话了AI创业者。
早在2023年,李彦宏多次呼吁,相较于“卷”AI大模型而言,“卷”AI原生应用更有价值。“不断地重复开发基础大模型是对社会资源的极大浪费。”“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”
本次,李彦宏再度指出,对于大模型创业公司而言,在精力和资源有限的前提下,既做模型又做应用的“双轮驱动”并非好的模式。
“创业者真正的优势应该是在某一个领域的知识、数据,”李彦宏表示,“市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。”
而在这个过程中,百度无疑希望构建自身的大模型生态。近日,百度智能云公布了过去一年以来大模型生态建设“成绩单”:已有超过8.5万客户,开发超过19万个应用,千帆大模型平台服务创企及伙伴超过12万家,活跃调用千帆API的创企和伙伴数量超过5.5万。
据百度方面透露,对于部分创业者而言,已经开始赚到了“第一桶金”。在接受包括21世纪经济报道在内的媒体采访时,百度智能云渠道生态部总经理陈之若透露,在百度的大模型平台上已经有厂商“赚到钱了”。
陈之若判断,考虑到第一波赚钱效应已经开始产生,今年下半年百度大模型伙伴的数量还将提升,到今年年底时第一波赚钱的厂商一定会出现,也会有更多的企业加入类似从0到1的路径中。
而在选择模型的过程中,李彦宏则强调,AI创业者无需担心使用闭源模型后被抄袭或“吃掉”的问题。他举例称,移动互联网时代微信并没有“吃掉”拼多多,滴滴也没有变为腾讯的一部分,“它们都各自提供了自己独特的价值,有自己非常不一样的竞争力”。