傅盛想捅破AI行业窗户纸 要做大模型数据加工厂

11月27日消息,猎户星空联合聚云科技举办了题为《Data Ready for Al,MoE大模型发布暨商业闭环分享》媒体活动。猎户星空正式发布了自主研发的Orion-MoE8×7B大模型,并携手聚云科技推出了基于该大模型的数据服务产品——AI数据宝AirDS(AI-Ready Data Service)。

猎户星空首席科学家韩堃介绍,Orion-MoE8×7B大模型是猎户星空自主研发的开源混合架构专家大模型,拥有8×70亿参数,采用了生成式混合专家的设计,涵盖了中文、英语、日语、韩语等多种语言。

据介绍,之所以发布该模型,是因为猎户星空在探索AI应用场景过程中,一方面以客户视角为出发点,模型既要效果好又要速度快;另一方面从大模型技术发展来看,相比稠密模型的“通才”、一群“专家”的MoE能更高效专业地完成企业复杂任务,而且在不显著增加计算成本的前提下大幅增加模型容量。所以,这款极具性价比的Orion-MoE 8x7B大模型是“为匹配企业客户需求而生”。

据了解,在主流的公开基准评测中,Orion-MoE8×7B与同规模参数级别的基座大模型对比,各项评测指标均表现优异,特别是在多语言能力方面展现出强大实力。此外,在推理速度方面也表现抢眼,显著高于同等参数规模的稠密模型。

与此同时,猎户星空基于研发MoE大模型对数据训练的认知理解和能力积累,携手猎豹移动旗下聚云科技共同推出大模型数据服务产品——AI数据宝AirDS(AI-Ready Data Service)。

猎户星空首席科学家韩堃介绍道,近年来,由于计算能力的提升、大规模数据集的可用性以及算法的改进,AI大模型进入爆发增长期,算力、算法、数据,是大模型发展的关键三要素。然而,相比于算法和算力,在大模型商业闭环中,数据明显成为最直接影响其在垂直行业落地效果的关键。

“捅破AI行业窗户纸,百模大战靠数据”,AI数据宝AirDS提供全方位的大模型数据服务,涵盖数据收集、清洗、标注、提示词工程以及评估等环节。在实际应用中,已服务包括移动通信终端、互联网娱乐、新能源汽车等多个领域的中国领先出海品牌,帮助客户显著提升AI应用的效果与效率,助力全球市场竞争。

猎豹移动副总裁童宁在会上详细介绍了AI数据宝AirDS的成功案例。例如,在移动通信终端领域,AI数据宝AirDS通过收集多场景、多语⾔数据,完成开发测试平台,优化prompt⼯程,提升⼤模型针对用户需求的数据返回准确率等等。(定西)