黄仁勋最新演讲:机器人领域将迎来“ChatGPT时刻”

导读

英伟达CEO黄仁勋受邀参加今年的CES展会,他在今天的开幕主题演讲中强调了两个核心:新显卡和AI,信息量极大。

CES开幕之前,英伟达市值创下近期新高,股价达到149.43美元,市值冲至3.66万亿美元。

黄仁勋表示:得益于AI对纹理和压缩算法的学习,英伟达新一代显卡RTX Blackwell 5090的性能是此前4090的两倍。

新推出的Blackwell超级芯片与英伟达上一代相比,每瓦性能提高了四倍。

在工业数据化方面,未来每个工厂都将拥有一个与真实工厂运作方式完全相同的数字孪生体。一切都在模拟中进行。

黄仁勋预测:自动驾驶很可能是第一个万亿美元级的机器人产业。英伟达推出了下一代汽车处理器——Thor,处理能力是上一代Orin的20倍。

机器人技术领域,特别是人形机器人和通用机器人技术,即将迎来ChatGPT时刻般的突破,有望成为世界上规模最大的技术产业。

英伟达还将推出一款AI高级计算机,开箱即用。

本期价值线为读者摘录了其中的精彩内容。

12年来,计算的每个层面都发生了革命性变化

如今,计算的每个层面都发生了革命性的变化,从手工编写在CPU上运行的指令到创建人类使用的软件工具,机器学习可以创建和优化在GPU上运行的神经网络,从而创造人工智能。技术栈的每一层都发生了彻底的改变,仅仅12年就发生了不可思议的转变。

现在,我们可以理解几乎任何形式的信息,包括文本、图像、声音、氨基酸和物理学知识,并进行翻译和生成。应用几乎是无限的,其核心都基于三个基本问题:输入是什么模态学习的?它翻译成了什么形式的信息?它正在生成什么形式的信息?

我们做了两件根本性的事情:使用可编程着色和光线追踪加速生成美丽的像素;然后让人工智能控制像素生成,大量生成其他像素。AI能够在空间上生成其他像素,因为它知道颜色应该是什么,最新一代的DLSS还能生成超出帧数的画面,甚至可以预测未来画面。

您看到的画面,例如四帧画面,实际上我们只渲染了一帧,其余三帧由AI生成。以全高清或4K显示四帧画面,大约有3300万像素,而我们只计算了两百万像素。这堪称奇迹。

可编程着色器现在也能处理神经网络。着色器能够承载这些神经网络,从而实现了神经纹理压缩和神经材质着色,最终获得令人惊艳的图像效果,这完全得益于AI对纹理和压缩算法的学习。这就是全新的RTX Blackwell 5090。

RTX 4090售价1599美元,现在,Blackwell家族的RTX 5070售价仅为549美元,却拥有4090的性能。这得益于四个顶级的、四个万亿次运算的AI张量核心和G7内存。 5090的性能是4090的两倍。

我们从一月份开始大规模生产,并成功地将这些强大的GPU应用于笔记本电脑中。

计算机图形学的未来是神经渲染。 人工智能与计算机图形学的融合令人惊叹。

Blackwell:大模型训练性能提升三倍

Blackwell目前已全面投产,由约15家计算机制造商提供200多种不同配置的系统,采用液冷、风冷等多种冷却方式,并支持多种CPU和NVLink配置,以满足全球数据中心的需求。这些系统目前在约45家工厂生产,反映了人工智能的普及程度和各行业对人工智能的转向。

这个NVLink系统,GB200,NVLink 72,重达1.5吨,包含60万个零件,相当于20辆汽车,功率为120千瓦。

它有一个背板,连接所有这些GPU,两英里长的铜缆,5000根电缆。这种产品正在全球45家工厂生产。我们制造它们,用液体冷却它们,测试它们,拆卸它们,并将它们以部件的形式运送到数据中心,因为它们重达一吨半。我们在数据中心外部重新组装并安装它们。生产规模令人难以置信。

但这一切的目标是,由于规模定律正在推动计算如此之快,以至于Blackwell与我们上一代相比,这种级别的计算使每瓦性能提高了四倍,每美元性能提高了三倍。这意味着在一代人的时间里,我们将这些模型的训练成本降低了三倍,或者,如果你想将模型的大小增加三倍,成本大致相同。

重要的是,这些是我们在使用ChatGPT或Gemini以及将来使用手机时都会使用的生成token,几乎所有这些应用程序都将消耗这些AItoken,而这些AItoken是由这些系统生成的。

每个数据中心都受到功率的限制,因此,如果Blackwell的每瓦性能是上一代的四倍,那么数据中心可以产生的收入、可以产生的业务量将增加四倍。所以,这些AI工厂系统如今确实就是工厂。

工业数字化场景将迎来重大变革

让我们谈谈物理AI。

我们需要做 的,是创建一个有效的世界模型,与GPT这种语言模型相对。这个世界模型必须理解世界的语言,理解物理动力学 (比如重力、摩擦力和惯性),理解几何和空间关系,理解因果关系(如果你扔下什么东西,它就会落到地上; 如果你戳它一下,它就会倒),以及客体永久性(如果你把一个球滚过厨房的柜台,当它滚到另一边时,球并没有进入另一个仍然存在的量子宇宙)。

今天,我 NVIDIA Cosmos是一个世界基础模型开发平台,旨在推动物理AI发展。

Cosmos优先考虑AV和机器人用例的独特需求,例如真实世界环境、照明和物体持久性。开发者使用NVIDIA Omniverse构建基于物理的、地理空间精确的场景,然后将Omniverse渲染输出到Cosmos,后者生成逼真的、基于物理的合成数据,涵盖不同的物体、环境以及天气、时间或极端情况等条件。

开发者可以使用Cosmos为强化学习AI反馈生成世界,用于改进策略模型,或测试和验证模型性能,甚至跨多传感器视图进行测试。

NVIDIA Cosmos,全球首个世界基础模型,利用2000万小时的视频进行训练。 这些视频重点关注物理动态事物,例如动态自然主题、人类行走、手部移动、操作物体以及快速摄像机运动场景。

其核心在于教AI理解世界,而非生成创意内容。通过物理AI,我们可以生成合成数据来训练模型,对其进行蒸馏,将其转化为机 器人模型的种子,并生成多个基于物理、物理上合理的未来场景,模拟“奇异博士”的场景。因为这个模型理解物理世界。

今天,我们宣布Cosmos采用开放许可,并在GitHub上开放。我们希望这个包含小型、中型和大型模型(快速模型、主流模型和教师模型,即知识迁移模型)的平台,能像LLAMA3改变企业AI一样,改变机器人和工业AI领域。

将Cosmos连接 到Omniverse后,其魔法便显现。Omniverse是一个基于算法物理学、遵循物理原理的仿真系统,即模拟器。两者结合,形成一个物理模拟的、基于物理的多元宇宙生成器,其应用前景非常广阔,尤其在机器人技术和工业应用领域。

我们如何将这些应用于工业数字化?

一切都在模拟中进行。未来,每个工厂都将拥有一个与真实工厂运作方式完全相同的数字孪生体。事实上,您可以使用Omniverse和Cosmos生成大量未来场景,然后由人工智能选择对任何KPI最优的场景,这将转化为部署到真实工厂中的AI程序或编程约束。

汽车自动驾驶时代已来

机器人领域将迎来“ChatGPT”时刻

另一个例子是自动驾驶汽车。自动驾驶革命已经到来。

全球每年生产1亿辆汽车,道路上行驶的汽车有10亿辆,每年行驶里程达万亿英里,所有这些汽车都将实现高度自动驾驶,甚至即将实现完全自动驾驶。这将是一个极其庞大的产业,我预测这很可能是第一个万亿美元级的机器人产业。我们的业务,请注意,仅仅是这些开始投产的汽车中的一部分,规模就已经达到40亿美元,今年的运行速度可能约为50亿美元。

今天,我们宣布我们下一代汽车 处理器——Thor。

这是Thor,一款机器人电脑,它接收并处理来自大量传感器的信息,包括无数个高分辨率摄像头、雷达和激光雷达。该芯片将传感器数据转换成标记,放入转换器并预测下一条路径。

Thor的处理能力是上一代Orin的20倍,而Orin是目前自动驾驶车辆的行业标准。Thor已全面投产,并广泛应用于各种机器人,例如自主移动机器人(AMR),可作为机器人或机械手的大脑。它是一款通用的机器人计算机。

机器人技术领域,特别是人形机器人和通用机器人技术,即将迎来ChatGPT时刻般的突破。

使能技术将推动通用机器人技术在未来几年取得令人惊讶的快速发展。通用机器人技术的重要性在于,它能创造出无需特殊环境就能适应“棕色地带”的机器人。

这三种机器人是:自主机器人和自主AI(信息工作者);自动驾驶汽车(适应已建成的道路和城市);人形机器人。如果我们拥有解决这三项问题的技术,这将是世界上规模最大的技术产业。

关键在于如何训练这些机器人,而对于人形机器人而言,模仿信息的收集尤其困难,因为汽车只需驾驶即可收集数据。

我们一直在探索人形机器人的运动学习。直接模仿人类演示对机器人来说效率低下,因此我们需要一种巧妙的方法,利用少量的人类演示数据,通过人工智能和Omniverse合成生成海量合成运动数据,从而让AI学习执行任务。

NVIDIA Isaac Groot合成运动生成的蓝图是一个基于模仿学习的仿真工作流程,能够从小数量的人类演示中生成指数级的大型数据集。最后,在将策略部署到真实机器人之前,开发人员可以在IsaacSim中进行软件在环测试和验证。

将推出AI高级计算机

开箱即用

我还想向大家展示一项技术, 旨在为研究人员和初创公司提供一款开箱即用的AI超级计算机。

过去,超级计算机的构建需要自行建造设施、搭建基础设施并进行复杂的系统设计。 2016年,我们向OpenAI公司交付了第一台DGX-1,埃隆·马斯克、伊利亚及众多工程师见证了这一时刻,DGX-1彻底改变了人工智能计算。

如今,人工智能已无处不在,不再局限于研究人员和初创公司的实验室。正如演讲伊始所言,我们希望人工智能成为一种新的计算方式,一种编写软件的新方法。每一位软件工程师、工程师、创意艺术家,以及所有使用计算机作为工具的人,都需要一台人工智能超级计算机。因此,我们希望DGX-1能更小巧一些。

这款AI超级计算机运行着完整的NVIDIA AI软件栈,包括所有NVIDIA软件和DGX Cloud。通过无线连接或网络连接至您的电脑,甚至可作为工作站使用。您可以像访问云超级计算机一样访问它,并在其上运行NVIDIA的AI。

它基于我们研发的超级秘密芯片GB110,这是我们生产的最小型的Grace Blackwell芯片。这款绝密芯片是我们在与联发科合作中研发的Gray CPU,专为英伟达打造。通过芯片到芯片的NVLink连接到Blackwell GPU。

这款小巧的设备目前正在全面生产中,预计将于五月左右上市,其功能令人难以置信。

如果您使用PC或Mac,它就是一个运行在您桌面的云计算平台,您可以将其用作Linux工作站。如果您需要双位数性能,只需使用ConnectX连接,它便具备Nickel、GPU Direct等功能,开箱即用,就像一台超级计算机,所有超级计算堆栈都可用,例如英伟达Digits项目。

本文源自:价值线