上游观察·科技|开源还是闭源?下一个转身的可能是OpenAI
上周,百度宣布未来几个月将陆续推出文心大模型4.5系列,并于6月30日起正式开源。
和此前的百度一样,OpenAI也是闭源大模型阵营的忠实拥趸。2月18日,OpenAI创始人山姆·奥特曼在社交平台发布了一条消息:OpenAI的下一个开源项目,到底是做啥更好?这一发问,引来业界诸多猜想。
无论开源或闭源,大模型广泛应用才能实现价值
开源或是闭源,只是为大模型在不同场景、不同阶段下选择合适的路线方向,没有孰对孰错。
近期,大模型行业出现这一系列变化,DeepSeek爆火是直接原因。半个月前,山姆·奥特曼在柏林工业大学一场圆桌对话中谈及DeepSeek。他说,世界上确实需要开源大模型,它们可以为人们提供大量价值,“我很高兴,世界上已经有一些优秀的开源模型。”
在DeepSeek的冲击下,OpenAI下一代大模型的路线方向有了更新的判断。其实在6年前,OpenAI彼时推出的GPT-2也是开源大模型社区的一员。但在随后的6年里,OpenAI一直坚持闭源策略。
对于大模型开源方向路线转身速度最快的是百度。此前,百度文心大模型坚守闭源阵营,最新的变化是,百度文心大模型下一代将全面开源。
2月18日晚,在百度2024年第四季度及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏对于这一变化谈及他的思考。李彦宏说,开源的决策源自对于领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景扩大其影响力。他还谈道,“但我想强调的是,无论开源还是闭源,基础模型只有在大规模解决现实问题时,才具备真实价值。”
开源将降低开发者门槛,促进更多创新应用出现
普遍观点认为,开源将降低开发者的门槛,促进更多创新应用的出现;闭源可能提供更稳定、高性能的服务,适合企业级应用。同时,开源可能带来不同模型之间的兼容性挑战,而闭源可能形成更统一的标准。
此外,考虑到数据隐私和合规问题,开源模型可能让企业更容易定制和审核,而闭源可能依赖供应商的合规措施。
无论开源或者闭源,将大模型应用于不同领域不同场景,才是大模型价值的最大呈现。场景优势,正是大模型在中国市场快速发展的重要因素之一。
北京大学重庆大数据研究院智能创新与赋能中心重庆负责人、重庆市中小企业专家委员会专家李解在接受上游新闻记者采访时谈道,开源大模型最大的价值在于它打破技术门槛,让中小企业和开发者有机会都能在同一个起跑线上用到高性能大模型。
她说,一方面,开源模型让大模型的竞争从比拼参数转向模型能力,模型能力训练成本降低,同时将加速大模型在产业落地;另一方面,开源模型在不同领域渗透落地,规模化落地将加速反哺推进各领域技术的创新。
结合重庆发展现状,李解谈道,重庆产业基础雄厚、产业结构完整,应用场景丰富、应用潜力巨大,基础大模型的渗透具有良好的发展条件。“重庆还有众多人才研发机构和科创高地,把应用场景和人才优势联系起来,大模型应用创新将带动新的发展机遇。”
未来大模型也不会全面开源化,闭源模型更适合高价值场景
目前,从全球来看,Meta、Google等开源模型的强大生态已经成形,开发者通过优化代码、开发工具链形成“雪球效应”,正在加速模型的迭代升级。另外,伴随商业模式的迭代升级,开源基础模型在支持企业模型调优、推动云业务增长方面能够形成协同效应。
市场观察人士汪健和记者谈道,我们可以拿智能手机操作系统做一个类比:比如安卓开源以后全球的手机厂商都在用,苹果的iOS可以理解为闭源,只有苹果自家在用。他说,“虽然开源免费公开了基础模型,但企业如果需要通过大模型定制服务,那还是得为大模型企业付费进行深层次打磨。”
汪健认为,对于普通用户来说,大模型开源可能有两方面的好处。第一,任何人自己下载开源模型就可以免费使用,就像之前去打印店打印需要付费,而现在,家里就有了免费的打印机随便用;第二,小企业、创业公司无需自己开发模型,通过基础模型进行调整优化,就能做出自己需要的模型产品。
未来大模型发展会不会“全面开源化”?多位行业人士一致认为,开源将成为基础模型的主流选择,而闭源模型将聚焦医疗、金融等细分行业的高价值场景。同时,结合商业模式的变化,混合开源模式也将成为选择之一,比如开放架构但保留训练数据,或者以商业盈利为第一选择的延迟开源,都可能成为大模型的演进路径之一。
上游新闻记者 杨昕华