路透:字節跳動新AI模型主要以華為晶片來訓練
字节跳动不仅已是华为AI晶片的主要买家,也是辉达(NVIDIA)专为大陆市场设计的H20 AI晶片的最大买家。路透
路透引述知情人士报导,TikTok的大陆母公司字节跳动新开发的人工智慧(AI)模型,计划改以华为晶片为主,减少对辉达(NVIDIA)晶片的依赖。
美国2022年开始管制高阶AI晶片出口以来,字节跳动已经分散转向国内供应商寻求货源,并加速发展自有的AI技术。
知情人士告诉路透,字节跳动在AI竞赛中的下一阶段,将采用华为的Ascend 910B晶片来训练大型语言AI模型。但也有消息人士透露,字节跳动正在规划一个新的AI模型,但无法确认是否会使用华为的晶片。
路透引述消息人士报导,字节跳动已经采用Ascend 910B用于运算需求较低的推理任务,这些工作采用预训的AI模型来做预测。
消息人士透露,字节跳动今年已采购超过10万颗Ascend 910B晶片,但截至7月拿到的还不到3万颗,交货进度太慢,无法满足公司的需求。
据报导,字节跳动不仅已是华为AI晶片的主要买家,也是辉达专为大陆市场设计的H20 AI晶片的最大买家。据消息人士透露,字节跳动也是微软在亚洲透过云端运算来采用辉达晶片的最大客户。
消息人士指出,字节跳动无法为新模型确定进度,即因为国内晶片供货有限,且相较于H20 晶片的运算能力不足。
字节跳动目前的AI技术应用于2023年8月推出的旗舰大型语言模型,此模型后来更名为聊天机器人「豆包」,并广泛应用于其他多种应用程式,包括文字转影片工具「即梦」。本月,字节跳动推出了两款专注于影片的豆包模型,要和OpenAI竞争。
今年初以来,相关应用使用量激增,字节跳动的聊天机器人成为中国广受欢迎的应用工具,每月活跃用户超过1,000万人。