聚焦WAIC丨垂直大模型的行业落地:是趋势,也需破局

21世纪经济报道记者 董静怡 上海报道

“过去谈概念,现在更多谈怎么落地。”7月6日,安永数据智能咨询服务合伙人陈剑光在2024世界人工智能大会的“知识改变世界——垂直大模型重新定义知识管理”的主题论坛上表示。

真正的落地,更多是靠垂直模型。现场嘉宾普遍反映,大模型在垂直行业中的落地已经从最初局限在特定行业拓展到各行各业。

不过,我国垂直大模型在企业场景中的应用尚处于探索阶段,市场上的大模型解决方案存在同质性问题,缺乏针对不同行业特点和需求的定制化服务,这在一定程度上限制了大模型的创新性和应用效果,许多企业仍在寻求大模型的最佳落地方案。

高质量的垂直行业训练数据缺乏,也成为制约大模型训练效果和应用性能的关键因素。

达观数据董事长兼CEO陈运文在接受21世纪经济报道记者采访时表示,虽然各行各业拥抱AI的态度比较积极,很多企业仍面临数据缺乏和数据基座没有打好的问题,尤其是中小企业。

垂直大模型的发展和应用,是一个复杂而多维的过程。它不仅需要技术的创新和突破,更需要对行业的深刻理解和知识的有效整合。

垂直模型的落地之困

垂直大模型是专门针对特定行业或领域开发的人工智能模型,它们结合了行业知识和场景化处理能力,以实现更精准和高效的知识管理与应用。

以达观为例,达观垂直大模型是“混合模型+垂直知识+场景应用”,它兼容了多种基座模型。

目前,垂直大模型在金融、档案管理、法律审查等领域有所应用。例如,国泰君安证券利用大模型提供智能投顾服务,上海市档案馆使用大模型进行档案的数字化和智能化管理。

不过,整体来看,大模型在各行业的应用场景和范式还相对有限,一方面,大模型目前主要应用于一些常见的场景,如文本分类、情感分析、机器翻译等,而在一些特定的业务场景或新兴领域中的应用还不够广泛。

另一方面,市场上的大模型解决方案存在较高的同质性,缺乏针对不同行业特点和需求的定制化服务,导致应用效果和创新性不足。

如何更贴近行业?高质量的训练数据是一大问题,缺乏足够丰富和高质量的垂直行业训练数据,限制了大模型的训练效果和应用性能。

“垂类模型更多关注细分行业专有数据,既包括与个人相关的用户数据,还包括企业资产行业数据。”中科曙光智能计算产品事业部副总经理胡晓东表示。

但这些数据并不容易获得。在一些细分行业中,例如工业领域,获取数据相对困难,不仅数据量较少,而且往往很难在企业之间共享。

中小企业更是一片数据洼地。陈运文向记者表示,许多中小型企业在过去缺乏统一的文档资料管理系统,这些企业的文档资料通常分散在员工的个人电脑中,难以进行大模型的赋能。

“首要目标是建立一个集中的文档管理库,将所有员工的文档资料集中存储。在此基础上,可以构建大型模型和上层的智能化应用系统。”陈运文向记者表示,“这是一个逐步的过程,首先需要打好基础。”

下一步则是知识的深度挖掘。陈运文向记者表示,如果垂直模型与专业知识的结合仅限于表面层次,这是不充分的。只有当这种结合达到深层次时,垂直模型才具有真正的价值。行业知识的深度挖掘能够带来更深远的意义和应用潜力。

这时候仍需要人的力量实现对模型的微调。“要人类专家来传授经验,大模型要做定向的修改去吸收这些经验,最后开发出针对性的产品。”陈运文表示。

亟需产业链合作参与

如何进一步提升行业模型的能力?中国工程院院士、复旦大学金融科技研究院院长柴洪峰认为,关键在于发现大模型在垂直行业中的涌现效应。

以金融行业为例,他认为,可以打造金融数据基座,构建一个广泛的数据基础,为大模型提供充足的训练材料,以提高模型在金融等垂直领域的应用效能。这也符合涌现效应突破需要的大数据、大参数和大计算尺度的要求。

但并不是完全依靠“大力出奇迹”。“既依靠‘大力出奇迹’的规律,又要用该规律在不同领域,用不同的算法来产生这种协同。”柴洪峰表示。

此外,柴洪峰提出了大模型在工程落地中的创新可能。他表示,将大模型与知识图谱结合,知识图谱提供可预期和可信的决策支持,这是“对外服务”;大模型则产生“幻觉”,即发现专家可能未意识到的新知识或洞见,通过不断的迭代优化,可以转化为新的知识图谱,从而扩展现有的知识体系,这是“对内发现”。

“可以用上述方式进行集成创新,实现知识的对外服务和对内发现的结合。”柴洪峰表示,由此进一步促进知识生产力的提升。

最后,他提出了合作的重要性,“通过软硬一体、供需统筹、产学研协同,创新管理合作模式,实现人才密度、科研强度、创新速度的有效集成,推动金融大模型技术的研发与应用,加速行业智能化和数字化转型。”柴洪峰表示。

而在实际应用中,上下游的联动、各行各业的跨界合作已经变得非常普遍。大模型的出现导致了人工智能价值链的重塑,意味着价值链上的各个环节正在重新定义它们的角色和贡献,明确了生态系统中每个部分应该提供的价值,例如数据的收集、模型的训练、应用的开发等。

百川智能副总裁邓江在圆桌论坛上感叹,过去接触的行业相对有限,主要是金融等少数几个行业,然而随着大模型的兴起,目前已经与来自各行各业的优秀企业和合作伙伴建立联系。

“不跨界合作很难赢。因为生产里面的各种角色都掌握了局部信息、片段信息,或者他拥有局部的优势。如果这个优势分散,产生不了最大的价值。”复旦大学金融科技研究院常务副院长、计算机科学技术学院副院长吴杰表示。

这也重塑了每个参与者的思维,即需要有全局视角。邓江表示,在基础研发中,除了提升模型的能力外,还需要考虑不同行业的需求和实际情况,将这些能力应用到实际的产业链中,以实现更高效的运作。

“最终要选择好在哪个产业链上作为优先突破的方向,让模型首先适配该产业链上所有生态伙伴的需求,这是大家要去思考的一个很重要问题。”邓江表示。

如今,生态系统中的各个部分,变得更加紧密地联系在一起,形成了一种推动整个行业发展的力量。通过开放合作和深入研究,解决复杂问题,并克服应用落地的最后障碍。