埃隆·马斯克 xAI 超级计算机震撼登场
人们常说,罗马不是一天建成的。好吧,但埃隆·马斯克只用了 122 天就打造出了据称是地球上最强大的人工智能训练系统。这位备受欢迎的亿万富翁可从不磨蹭。
马斯克的新玩具,被称为“巨像”,由他新成立的人工智能初创公司 xAI 打造,是为了训练最新版本的 GROK 语言模型,也就是 GROK-3。它由不少于 10 万个英伟达 H100 GPU 提供动力。
如果这还不够,在 X 帖子中马斯克表示,“巨像”的能力将在“几个月内”翻倍,这得归功于另外新增的 5 万个 H200 英伟达芯片,每个芯片的人工智能加速性能大约是 H100 GPU 的两倍。
目前还不清楚这一切给马斯克和 xAI 带来了多少开销。
英伟达 H100 GPU 的价格估计,每颗从 2 万美元到高达 9 万美元不等。
想必,马斯克一次性购买 10 万个,成功设法获得了一个相对不错的交易。
但即便按照较低的估计,仅第一阶段购买英伟达芯片就得花费 20 亿美元
更别提建设数据中心、所有相关的基础设施、人员的配备,以及为先进的 LLM 开展设置培训所涉及的所有工作。
哦,还有另外那 5 万个 H200 的成本,权当是一点小点缀。
事实上,就在几周前,xAI 才将 GROK-2 作为 X 订阅用户的独家访问项目推出。显然,GROK-2 在训练时仅使用了微不足道的 15,000 个 H100 芯片,可怜的小人工智能。然而,从某些方面来看,GROK-2 在 LLM 排行榜上排名第二,仅次于 ChatGPT-4o。
所以,即使是第一阶段也将比 GROK-2 强大六到七倍,而仅仅几个月后算力就应该会翻倍。显然,马斯克的目标是打造出最强的 LLM。
至于 GROK-3 可能何时推出,马斯克上个月刚刚告诉保守派辩论家和后来的播客主持人乔丹·彼得森,他希望 GROK-3 能于 12 月上线。
顺便说一句,这样的机器并非没有连带后果。位于田纳西州孟菲斯的新集群会消耗 150 兆瓦的电力,并且每天已被分配多达 100 万加仑的水用于冷却。
因此,把环境影响加到因“巨像”而感到不安的原因之列,同时,还存在对于人工智能直接影响以及马斯克愈发不稳定的更广泛忧虑。这已经足够让人去应对啦。