清华大学孙茂松:企业不要“重复造轮子”,要做专用领域的大模型
11月28日消息,近日,在2023大模型产业前沿论坛上,中关村科金正式发布了国内首个企业知识大模型、AgentGraph应用开发平台,以及“超级员工”助手系列AIGC应用。
清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松表示,大模型在知识领域的应用,从学术界来看还是有很大的发展空间。未来大模型的趋势将有以下几个重要方面:一是走向具身智能,即用语言大模型控制机器人,向机器人发出指令,未来两三年这一领域可能会有大发展。二是全民化的人工智能,大模型在图像生成、文本生成方面能力都很强。三是机器人客户,例如无人驾驶汽车可以自动去充电、加油并完成相应的消费,有机构预测,到2026年全球将有近150亿台联网产品具备成为客户的潜力。
会后,孙茂松教授以及中关村科金技术副总裁张杰博士接受媒体采访时谈到,现在是通用人工智能难得发展的好时机,但是人工智能在垂直领域的应用落地,却还有许多疑难问题等待解决。
孙茂松向本站科技等媒体表示,在通用大模型基础上再去训练某一领域的专属大模型,第一需要尽量多的收集该领域权威数据;第二需要分析该领域数据特点,然后针对性的构建领域大模型,比如金融领域表格特别多,大模型对于表格理解不太擅长,就需要设计和改进针对表格的处理,强化大模型这些方面的数字处理能力,这部分其实还是不容易的,但是必须要去做,有很多改进的空间。
在大模型热潮席卷下,中国已经出现了“百模大战”盛况。在孙茂松看来,“百模大战”现象的出现是正常的。这一现象的出现说明,中国这些年人工智能的研究和技术发展不错。“我们国家在人工智能方面的科技研究处于跟跑状态,而有100家能跟上,说明技术基础不错,应用做的不错,我们国家过去十几年来人工智能的发展,总体来说也不错。”
谈到企业如何落地的问题,孙茂松强调,企业不要“重复造轮子”。“重复造轮子指得是通用基础大模型,对于企业来说成本高企,没必要投入有限的资源和精力放到构建一个基础大模型上,对于企业而言机会在你自己专属的领域里面做事情,去做专用的领域大模型。”
中关村科金技术副总裁张杰博士则建议,企业应用大模型的时候不一定同一场景下用一个大模型,也不一定用千亿级别规模参数非常大的模型,具体场景可能几十亿参数模型就可以把场景问题解决到极致。比如财富管理领域,只需要50亿参数的大模型就能很好的用于营销、客服等场景,那就没必要做成千亿参数,避免用大炮打蚊子,节省算力消耗的资源。“未来根据场景微调大模型可能会是一个企业里高频的需求。”(一橙)