陆AI企业突围 压低大模型成本

集微网21日报导,大陆互联网巨头阿里巴巴、百度、字节跳动等也大打价格战,以降低推理成本(即调用大型语言模型生成回应的价格),促使大模型价格下降90%以上。零一万物表示,透过建构以较少数据量进行训练、需要较少运算能力的模型,并优化硬体,该公司已降低推理成本。

AI专家、零一万物创办人李开复15日曾在脸书发文指出,零一万物晋升为全球大型语言模型第三名的公司(注:与亿万富豪Elon Musk旗下公司xAI并列),在评测平台LMSys Chatbot Arena最新排行榜中,仅次于OpenAI、Google。

李开复表示,Yi-Lightning是一个小的专家混合(MOE)模型,具极高速度且成本低廉,每百万个token仅需0.14美元,反观GPT-4o成本为4.4美元。Yi-Lightning性能与xAI的Grok-2相当,但Yi-Lightning是在2,000张H100 GPUs上进行一个月的预训练,成本仅300万美元,远低于Grok-2。

目前零一万物、深度求索等许多大陆AI企业,都采用专家混合(MOE)模型方法。研究人员表示,该方法是达到与密集模型相同智慧水准,但运算能力较低的关键方法,却也更容易失败,主因是工程师必须协调多个「专家」的训练过程,而不是在一个模型中。

由于难以获得稳定供应的高阶AI晶片,大陆AI企业在过去一年内争相开发最高品质的资料整合,以训练这些「专家」,期盼在竞争中脱颖而出。