提升生成式AI的价值,研发与应用相统一迫在眉睫

通信世界网消息(CWW)近年来,生成式AI发展如火如荼,从最初的“百模大战”到近来的“百机大战”,这两种规模性的投入和发展,虽都有研发和应用之意,且研发是为了商用,但是前者更侧重于高水平的研发,后者则倾向于应用研发并尽快投入应用,其中不可避免地存在一些认知和操作上的矛盾。解决这些矛盾的过程,就是促进研发与应用统一的过程,这必将带动人工智能水平的提升和智能产业的发展。

生成式AI在研发与应用上的矛盾

AI无疑拥有巨大的增长潜力和广阔的应用前景。然而,对于AI大模型、行业模型、智能体的研发属于科学、技术还是工程,业内存在不同的说法,同时在研发和应用方面存在若干矛盾和挑战。

大模型研发扩张与应用放缓的矛盾

大模型的出现颠覆了人们的认知,不少公司将大模型研发当作投资重点,意图抢占行业制高点,但这些公司并不清楚大模型的规律,在研发过程中才逐渐感受到大模型对庞大算力、海量数据和算法的严苛要求。从宏观层面看,“百模大战”极有可能导致重复建设和资源浪费的问题。尽管通用大模型在营销、办公、客服、人力资源、基础作业等领域已开始应用,但是各行业对AI成果的应用速度有所放缓,并且通用大模型已有成果更适合toC领域,面向产业转化的情况较少。而投资界、科技界、社会大众以及媒体都将目光聚焦在模型的功效上,以至有人呼吁不要只在模型研发上“内卷”,还要在应用研发上发力,没有应用,大模型将一文不值。事实上,不能让人们的注意力长期停留在对大模型的争论中,要让科技工作者关注AI的深入研发,让更多企业投入到AI已有成果的应用中,以此推动人工智能的探索和发展。

通用大模型与行业大模型的对立

当前,AI逐渐从全面探索阶段迈向规模试点和特定领域的智能生成阶段,需要根据不同领域的需求定制AI解决方案。通用大模型和行业大模型都是生成式AI领域崭新的探索方向,前者侧重于广泛领域和理论研发,后者大多是针对特定领域的应用研发。研发通用大模型所需的数据量大、算力损耗多,很难在短期内实现应用落地,因此不少公司转向行业大模型研发,这是在探索和实践过程中一种现实的选择。

然而,围绕大模型的深入研发和已有成果的尽快应用,在不同观点的争论中逐渐形成两种较为明显的态度:一种是追求技术,主张走通用大模型之路,以拥有“更大更强的AI能力”;另一种则是希望将AI成果尽快应用于市场,走产业发展之路,也就是将“足够的AI能力”快速变现于商业场景,利用市场庞大且独特的数据构建竞争“壁垒”。这两种观点皆有其合理性,但都容易走向极端,行业应该倡导二者“相互理解、相互吸收”,将力量集中于符合我国实际情况的研发和应用方向上,以此推进“AI+”行动的落地。

开源模式与闭源模式的张力

大模型的开源和闭源是研发企业所选择的不同模式。开源即开放软件源代码,允许任何人获取并修改软件的源代码,借助更大范围的开发者、研究者和爱好者的协作,拓宽技术创新边界,为人工智能的发展注入活力。闭源则是软件源代码仅掌握在软件编写者或系统开发商手中,通过对核心技术和商业模式的保护,使企业能从技术成果中获得经济回报,在涉及敏感信息和高安全要求的领域,闭源形式尤为重要‌。

大模型的这两种模式反映了技术进步与社会价值、经济效益、安全保障之间平衡关系的探索,而开源和闭源之争,实际上是对这种平衡的不同选择和追求。选择开源的企业希望通过全球合作推动技术创新和应用发展;选择闭源的企业则以保护自身技术和商业利益为重点。例如,OpenAIo1模型在交互过程中默认隐藏了思维链,或许是不想让其他开发者和用户知晓模型思考的全过程。开源和闭源的矛盾,体现在商业模式和技术选择方面,也反映出不同企业对未来发展的战略考量。

黑石集团董事长苏世民认为,企业在大模型研发方面更具优势,无论是从数据积累情况、算力投入规模,还是从研发本身所具备的技术和工程特性来看,相较于大学,企业在大模型研发上更易于取得突破。同时,通用大模型的研发为行业模型、智能体以及各行各业的应用提供支持,并且在应用过程中,各行业丰富的场景、海量的数据、优势的资源投入,又反过来进一步强化了通用大模型的研发,使科技研发和应用相辅相成,最终达成有机统一。

如何将AI研发与应用统一起来

AI的研发和应用是逻辑发展上的统一体,出现上述矛盾有其特殊背景和原因,需在深入发展进程中加以化解。

发展链路将研发与应用统一起来

自大模型诞生以来,生成式AI逐渐形成了一条独特的发展脉络,即“大模型—行业模型—智能体—机器人”的发展链路。在这个链路中,每个环节都有其相对独立性,它们按照技术逻辑有序地发展。

一要重点发展几家通用大模型,提高我国AI技术竞争力。

目前,行业对通用大模型尚无统一的定义,多数人理解的大模型包括大语言模型和多模态大模型。通用大模型在技术和理论层面展现出了强大能力,可为各个领域赋能并带去机遇,是重塑人类社会的重要因素。不过,通用大模型不仅所需的参数规模和算力规模都非常大,且在遇到数据瓶颈、算力瓶颈的情况下,不知还需要多长时间、多大投入,才能够实现新的突破。按照Kimi创始人杨植麟的理解,OpenAIo1模型在天然数据不足的情况下,借助较好的基础模型展开强化学习,由此创造出很多非天然的数据,提升了模型的数据质量和计算效率,进而催生出更为深入的思考和推理,实际上该模型创造了一种新的范式。

由此可见,深入研发通用大模型,意味着要持续迎接挑战,向通用人工智能的目标迈进。因此,从事大模型研发的企业不必过多,而由于美国对我国实施AI技术限制,我国必须要自主研发出一些具备世界竞争力的通用大模型。人工智能专家吴军认为,“现在全世界成规模的大模型企业没有几家,美国大概有5~10家,欧洲基本上就法国有一家,每个国家都构建一个大模型是不现实的,这很耗费资金,我国应重点扶植不超过10家。”目前,我国的Baichuan3、智谱GLM-4、腾讯混元、通义千问2.1、文心一言4.0、华为盘古、Kimi、豆包等大模型走在行业发展前列。除上述大模型做得好的公司外,我国互联网大厂、相关大型企业拥有海量数据,且有实力解决算力问题,这也符合大模型研发的条件。

大模型具备通识和泛化能力,但由于在应用过程中存在数据隐私、算法偏见,以及数学和逻辑推理能力不足等问题,因此通用大模型难以满足具体行业的特定需求、专业性能和经济效率。而由于缺少细分度更高的产品,在公有云提供服务时会引发企业对私有数据、敏感数据安全性的担忧,大模型的使用也需要通过传统的磨合流程来实现产品与市场的契合。目前将通用大模型融入核心业务流程的案例较为少见,相比之下,行业大模型更有利于发展专业能力和实现精准赋能。但也有专家指出,现在的产品在很大程度上是由模型能力决定的,要把产品和模型更紧密地结合起来进行思考。例如,在产品上实现某个功能,其背后需要对应模型能力的支撑。此外,有互联网大厂的企业家强调,大模型赋能智能体的实践意义更大,应用前景广阔。

二要大力发展行业模型和业务模型,发挥我国产业齐全和技术应用的优势。

行业模型是指“利用通用大模型技术,针对特定数据和任务进行训练或优化,从而形成具备专用知识与能力的模型及应用。”国际上更多地使用垂直模型这一表述,在我国还有垂类模型、领域模型、专属模型等称谓。行业模型本质上是一种解决方案,从用户更关注产品而非技术的这一实际情况出发,尽快将技术转化成产品,才有利于解决问题。行业大模型提供的不仅是产品和工具,还有定制服务与支持,这需要用户参与共建。一方面,企业为了提升自身竞争力、实现智能化转型、满足市场需求,期望将数据转化为核心驱动力,因此主动寻找最佳模型;另一方面,AI技术公司也在选择对“以人工智能提升发展质量”有需求的特定行业、企业、产业开展合作。研发方和需求方结合,共同深耕“人工智能+行业/产业/企业”,利用行业专业数据或私有数据、特色应用场景等独特资源,对模型进行定制调整和优化,能够使其较快地投入应用,有针对性地解决问题,进而创造价值。行业模型和智能体是相互关联且互补的,二者共同推动AI技术的产业化发展。

三要把智能体和机器人作为智能发展的重点,培植和壮大智能产业。

智能体是具备智能的实体,它以云为基础,以AI为核心,构建起一个立体感知、全域协同、精准判断、持续进化且开放的智能系统。智能体包括智能行为的物理实体和虚拟存在,例如物理形态的机器人和虚拟形态的数字人。智能体的能力远超近年国内使用的Siri、小爱同学、天猫精灵等智能助手,可以帮助用户处理更加复杂的任务。在大模型技术的加持下,智能体将具有自主性、感知性和行动能力,可在复杂环境中自主决策、学习进化,更接近人类智能的本质。随着新型芯片技术的发展,无人汽车、无人机、机器人等颠覆性的智能体将不断涌现,从而实现更高层次的智能化。这种应用驱动的AI研发,其目的在于使智能体成为人类广泛使用的商品,用户也可根据使用环境和用途,按需定制形状、大小及功能各异的智能体。

机器人是智能体中重要的一类,与传统机器人相比,具身智能机器人有泛化性优势。传统工业机器人可解决固定搬运、固定点位焊接、喷涂等方式相对固定的问题,但在工序复杂的总装过程中,工业机器人的表现却不如人工安装,而大模型赋能的智能机器人则可以解决此类问题。工业智能机器人的落地应用速度将快于家用机器人,预计在未来3~7年实现批量生产,家用机器人因任务复杂程度高,且对于任务完成的满意程度标准各异,需要5~10年才能实现量产。

上述智能方式均需开展技术研发,也都有很高的应用价值,它们共同构成了人工智能的发展格局。研发为应用打基础,应用是研发的目的,在宏观上体现了研发与应用的统一。

‌ 扬长避短将AI研发和应用统一起来

AI发展包含研发、应用等环节,不过并非每个企业都要按顺序将各环节做一遍。在全球化、数智化、市场化的大背景下,只有扬长避短,才能在AI发展进程中实现相互成就与发展。目前,在人工智能的各个环节中,美国在研发方面处于领先地位,并带动技术应用。美国去工业化后,其产业结构以金融和服务业为主,而通用大模型的应用能够直接覆盖金融、财务、审计、研发、法律、医疗等领域。我国产业齐全、制造业发达,更适合AI快速应用于产业、行业和社会等各个层面,加之我国拥有互联网应用、数字技术应用的丰富经验,在通用大模型研发的带动下,大模型已在金融、服务、文教、医疗、创作等领域广泛落地。

当前,除了几家推出通用大模型的企业应加大研发力度之外,还要发挥我国在技术应用方面的优势,重点加强行业大模型、业务模型、智能体、机器人等不同方向的应用研究,使少数骨干公司的大模型研发成为赋能各项AI应用的“蓄水池”,使AI的各种应用直接服务于具体产业,让它们既能承接通用大模型的技术赋能,又能结合行业、企业和社会应用的场景和需求,向智能产业、智能应用方向发展。同时,将丰富的应用场景等资源和问题反哺给大模型研发,形成通用大模型研发与AI应用“相辅相成、相互促进”的良性循环。

运用灵活方式将研发与应用统一起来

我国“百模大战”中的企业大多是研发通用大模型的,在全球范围内,我国研发的大模型数量位居前列,且有开源和闭源两种模式。随着AI技术逻辑的演进,行业对大模型的认识不断深化,从能力、需求、成本、市场等多个角度进行考量,并不需要过多的公司都挤在大模型研发这座“独木桥”上,此前一些致力于大模型研发的公司,可适当转到AI应用“赛道”。

一种方式是,原本做通用模型研发的公司改做行业大模型。这些公司积累了扎实的知识基础和丰富的交互体验,知道如何承接大模型的技术赋能,进而做好行业模型。另一种方式是,基于通用开源大模型开展行业大模型研发。这种方式能够针对模型结构、参数等按需调整,更好地适配用户的个性化需求。市场上的金融、法律、教育、传媒、文旅等行业模型,大多是在Llama、SD、GLM、Baichuan等国内外主流开源大模型的基础上构建的。以上两种方式都无需大量的算力和数据,可节省大量训练时间和成本,也能放心地利用私有数据提升应用效果,减少数据安全方面的担忧,使企业更好地从AI技术研发转化到应用研究上来。

此外,企业还可以开发一种比行业模型更灵活性的领域模型或业务模型,这类模型更适合国内市场极为丰富的业务场景,有助于促成生成式AI的规模化商用。领域模型更适用于超大规模的AI应用市场和多种服务模式。中国信息通信研究院数据显示,2023年我国人工智能产业应用进程持续推进,核心产业规模达到5784亿元,其中不少属于行业大模型、领域模型以及AI工具的应用。例如,有一家公司开展AI视频面试业务,2023年业绩比上一年翻了一倍有余;义乌一个女老板运用前沿的AI视频技术,化身语言达人,能够熟练切换多国语言介绍自家生意。诸如此类的AI研发和应用案例,都值得推广。

提升生成式AI发展质量和价值的建议

我国人工智能研发势头正旺,智能产业前景乐观,AI应用有望迎来蓬勃发展。不过,从现阶段的探索和实践情况来看,行业需进一步夯实AI基础建设、开展技术创新、拓宽商用渠道,统筹处理AI研发、产业化和应用之间的关系。

营造良好的政策和服务环境。我国已针对AI的标准、能力、伦理、创新、治理等方面,出台了相关政策和法律,以确保技术发展与社会的价值观和伦理标准相符,营造出拥抱AI发展的社会环境。政府部门、行业协会和市场监管部门对于刚起步的生成式AI研发和应用,应该秉持包容的态度,逐渐引导规范,使其走上健康发展的轨道。

AI技术产业化要为产业的智能化开路。运营商、软硬件设备提供商、互联网企业是大模型应用的先行者,它们数字化程度高、数据积累丰富、技术接受能力强,将成为大模型落地较早的领域。这些领域的大模型应用场景广丰富,覆盖了营销、客服、内容生成等诸多环节,目前已有丰富和成熟的经验,其带动示范作用以及提供的大模型服务、工具、产品,正在传导到制造等产业,促进企业从数字化向智能化转型升级。随着各种智能载体逐渐成熟落地,在改造、提升传统产业的同时,企业将朝着产业智能化的方向快速发展。

打造坚实的AI技术底座。行业要着力建设算力中心,促进算力统筹协同。随着性能和易用性的提升,国产算力将获得AI公司和应用企业的青睐。要有效地积聚高质量数据,扩大数据交易,发挥数据的资源和要素作用。要以创新精神研发智能产业的不同载体,避免同质化问题,展现技术、产业和应用的特点和优势,打造与众不同的产品和服务,进而提升价值、规模推广。

*本文刊载于《通信世界》

总第956期 2024年11月25日 第22期