AI(人工智能)芯片龙头英伟达CEO黄仁勋在英伟达GPU技术大会(GTC)上打开了线日,在座无虚席的英伟达GTC大会主题演讲结束后的第二天,黄仁勋参加全球媒体采访,回答了来自二十几家媒体的采访问题。
这些问题丰富多样,从英伟达的公司发展前景,到AI、云计算、机器人乃至量子计算机的未来,再到国际形势和全球供应链情况,各种问题都被投向了最近因其名声与热度而获得“科技界泰勒·斯威夫特”称号的黄仁勋。
在采访中,黄仁勋深入浅出地介绍了公司旗下几项核心技术的原理,并再三强调,英伟达并不只卖芯片,而是瞄准了潜力巨大的数据中心市场,希望能做到“无处不在”;由于供应链的庞大和产品的复杂程度,英伟达的芯片由来自全球各地的零部件组成,也在努力增强供应链的韧性;另外,AI的重大贡献之一在于弥合技术鸿沟,能够让任何人都像和人交谈一样指挥软件。
欢迎来到GTC。来自世界各地的媒体,很高兴见到你们所有人。我(在开幕演讲上)谈到了五个主题。首先,我们的行业正在同时经历两场转型。第一场转型是关于计算机的制造方式,以及计算机从通用计算转向加速计算的构建方式。第二个转型是它能做什么。也就是说,第一场是加速计算,第二场是它能做的事情,我们称之为生成式AI。由于生成式AI,出现了一种新型的工具,这种新工具就是AI生成器。有些人称之为数据中心,但如你所知,数据中心被很多人使用。它能够存储大量文件,并运行许多应用程序。你可以用它做很多不同的事情。但在生成式AI的情况下,它只做一件事。
它(生成式AI)为一个人,或公司,处理一件事,并生产AI,即生产令牌(token)。作为一种性的AI,当你与ChatGPT互动时,它正在生成代币,生成浮点数(floating point numbers),而这些浮点数能变成文字、图像或声音。蛋白质、化学物质、计算机动画和机器人,它们对机器来说与说话没有区别。如果计算机可以说话,为什么不能使机器动起来呢?因此,这些能力,这些代币生成器是一个全新的类别,一个新的行业。这就是为什么我们说正在发生一场工业,因为它是新的。这个新行业创造了这些(服务器)房间、这些建筑,我称它们为AI工厂,因为这是最合理的。
在上一次工业中,流入工厂的原材料是水。出来的是一种看不见的东西,称为电。现在,我们有了这种流入工厂的原材料,也就是数据,而从中产生的是数据令牌(data tokens)。这种令牌同样是看不见的,它可以被分发到全世界,非常有价值。在过去,数据中心被算入你公司的成本,被视为运营费用,进入资本支出,你认为它是一项成本。然而,工厂是能够赚钱的。因此,这个新世界拥有新的生成式AI、新的工厂,也就是AI工厂,是一个新的工业。大家能理解吗?好的,这就是正在发生的第一件事。
这场转型是英伟达引领的加速计算,然后是第二个,生成式AI。在这个新世界里,软件极其复杂。ChatGTP的实现绝非易事,它是有史以来最伟大的科学突破之一,这款软件非常庞大,并且还在不断扩大,原因是如今你想让它学习的东西太多了。它从文字和图片中学习,它还将从视频中学习。它将学习强化学习,学习合成数据生成。它将通过相互对话进行强化学习,就像AlphaGo那样,通过相互辩论来学习。它将以许多不同的方式进行学习。因此,这些模型将随着时间变得越来越复杂。
我们为这个未来创造了全新一代的计算工具,这个未来模型拥有万亿参数。我们称之为Blackwell。Blackwell在几个方面是性的。首先,它的设计非常高效能和节能。我在演讲中展示了一个例子,训练相同规格的1.8万亿参数GPT将在90天内完成,不需要15兆瓦,而是仅需4兆瓦——你节省了11兆瓦。因此,我们极大地降低了工作的能耗。能效是工作量除以输入,而工作量是对模型的训练模型。在90天内,输入量为4兆瓦,节省了大量能源,当然也节省了大量金钱。这是第一个突破。
第二个突破是在于生成,人们首次开始考虑AI不仅仅用于推理。例如,这是一张猫的图片,显示了对猫的预测推理。而在推理之外,虽然依然属于推理范畴,但有一个深刻的不同,那就是生成的出现。它在推理,但同时也在生成,不仅是识别,而是生成,不仅是理解,而且是生成AI。Blackwell被设计为一台生成型计算机,这是数据中心首次以这种方式理解我们的GPU。
现在,如果你是一个游戏玩家,你一直认为英伟达的GPU是一种生成型计算机。不是吗?因为你看到的所有图像都是由英伟达的GPU生成的,但在未来,从图像、视频、文本到蛋白质、化学物质、运动控制——它们都将被生成,并且都将由GPU生成。这实际上挺有趣的,几乎是《回到未来》。我们的GPU从生成处理器和计算机图形生成,变成了AI学习处理器、AI推理处理器,现在又回到了开始的AI生成处理器。在未来,我们几乎所有的计算体验都将主要是生成的。今天不是这样,这就是为什么这个机会如此巨大的原因。
当你在做计算时问问自己,当你在手机上操作时,那个文件,那些信息都是预先录制的。有人提前写下它,有人提前拍下照片,有人提前录制视频,一切都是预先录制的。在未来,它将由那种预录内容增强,但为你生成独特的方式,这就是为什么每个人的计算体验都将非常不同的原因。我们不再使用搜索。搜索将通过生成进行增强。我们称之为RAG,即检索增强生成。因此,在未来,我们几乎所有的体验都将是生成的,而这种生成引擎需要一种特殊类型的处理器,那就是Blackwell。我们用全新的transformer引擎创造了Blackwell,一个第二代transformer,以及一个非常大的NVlink,这样我们就可以非常快速地生成大量信息,并同时并行多个GPU。所以这就是Blackwell。
第三件事是,在这个新世界中,我们能够编写的软件是不同的,它非常复杂,但大公司、企业如何像使用Windows那样使用这些软件呢?它以二进制形式存在。你下载它,安装它。在SAP的案例中,你的IT部门为你安装它。一些应用程序在云上,但如果你想创建自己的应用程序,而你需要内置这种称为AI的不可思议技术。你该怎么做呢?因此,必须有人找出一种方法,将这种非常复杂的软件与所有的高性能计算技术、所有的GPU技术、所有的Tensor RTLM和分布式计算一起,打包进一个容器中,使人们易于使用,同时也易于下载和使用,意味着你可以直接与它交互。
真正酷的是,在未来,软件就是AI,你与软件的交互方式就是直接对话。因此,AI软件即将到来。它将非常易于使用。API非常易于使用,非常自然,你可以将许多这样的AI连接在一起。我们称它们为NIMs,我们称它们为NIM微服务,我们将帮助公司将它们连接在一起。你可以直接使用,可以定制它,我们可以教你如何定制它,你可以将它连接起来。我们可以教你如何将它与许多其他应用程序连接起来。因此,我们讨论了NIM,讨论了这项服务。我们将帮助客户定制他们自己的NIM的方式,我们称之为AI工坊(AI foundry)。
我们拥有AI技术,我们拥有执行它所需的工具,当然还有公司的基础设施,这三样东西——技术、专业知识和基础设施,基本上就是一个工坊的特点。因此,我们可以帮助每个公司构建他们的定制AI。现在,谁会想要定制AI呢?那些拥有平台的公司。因此,SAP、ServiceNow、ANSYS、Cadence、和NetApp等都想要定制AI。因此,我们可以与他们合作,帮助他们构建他们的定制AI,我们可以像工坊一样为他们制造这些AI,他们可以自己将其推向市场。这就给出了一个例子,说明我们将如何利用这项AI技术,并将其带给世界。
我谈到的最后一件事是AI的下一个浪潮,需要AI理解物理世界。当然,你们已经看到了包括OpenAI的Sora在内的一些具有性的AI。当Sora在生成视频时,它实际上是有意义的。汽车在路上,它会转弯,人在街上行走有反光。显然,AI懂得物理学,对吧?它懂得物理定律。因此,想象一下如果我们将其推向极限,那么AI实际上可以在物理世界中行动,这就是机器人学。
因此,下一代技术需要新的计算机来在机器人中运行。我们称之为Omniverse新工具,让机器人可以在数字孪生中学习。当然,我们还需要发明一些新的AI模型,新的基础模型。因此,整个堆栈,也就是我们进入市场的方式,正如你们所知,我们是一个技术平台,而不是一个工具公司。我们有开发者,Omniverse是我们的数字孪生,通过API或SDK,我们与开发者相连。
这次我们宣布了很多伟大的开发者。3D Excite将连接到Omniverse API,增强逼真的渲染和基于物理的渲染。西门子、Cadence、Blackwell、Hexagon等都已连接到Omniverse APIs,他们可以使用这些Omniverse APIs创建数字孪生,并成为我们的超级合作伙伴。我对Omniverse在连接这些工具方面的成功感到非常高兴。这些工具本质上被Omniverse增强,我对此感到非常高兴。
所以这就是我们讨论的五件事。Blackwell既是一个芯片的名称,也是一个计算系统的名称。这是HGX平台,从Ampere A100到H100、H200、B100以及B200版本,这个版本真的很棒,与Hopper完全适配。因此,你可以拿掉一个Hopper,换上一个Blackwell。这种生产过渡将让客户增长变得更加容易,因为基础设施已经存在。我们还有一个新的架构,采用液冷技术,允许我们创建非常大的NVLink区域,在一个NVLink域中创建8个GPU。我们希望有更大的GPU。也就是说,一个GPU, 8个Hopper裸晶(die)。在Blackwell的情况下,就是16个裸晶,每个硅片裸晶带来显著突破。所以,无论如何,那就是Blackwell。
但是,如果我们想要创建更大的,我们可以一直实现下去。我们可以将多个版本的Blackwell和Grace CPU堆叠在一起,它们通过NVlink开关连接在一起,NVLink开关就在这里,这是世界上性能最高的开关,我们堆叠了9个这样的开关,能连接36个芯片,76个GPU。好的,我可以接受提问了。
想问一下,你们计划将多少新的网络技术卖给中国,以及,我们有任何专为中国市场设计的SKU(商品库存)吗?这些SKU可能集成了一些其他技术,除了计算裸晶,由于计算密度你无法将其送去售卖,但你们还在开发哪些集成了其他先进技术的新SKU,除了我们昨天看到的那些?
我刚刚才宣布了这个SKU。不,我们今天所说的就已经是全部了。当然,我们卖给中国的任何产品都必须遵守出口管制规定,那是首要任务。所以我们会考虑这个,我们正专注于这个。对于中国,我们有L20和H20芯片,我们正在尽我们所能地为中国市场优化它们,并服务于那里的客户。
你在主题演讲中提到,英伟达是一个与许多企业合作的AI工坊,我认为这非常重要。你能分享更多关于你们的整体策略和长期目标吗?
AI工坊的目标是构建软件AI,不是将软件作为一个工具,但请记住英伟达始终是一家软件公司。我们很久以前创建的最重要的软件之一叫做Optics,后来它变成了RTX。另一个非常重要的是叫做cuDNN,cuDNN是AI库。我们有所有这些不同的库。未来的库是一个微服务,因为未来的库不仅会用数学描述,还会用AI描述。所以这些库,我们过去叫它们cuBLAS,还有一大堆“cu”,但在未来,它们都是NIMs。这些NIMs是超级复杂的软件,你所需要做的就是来我们的AI网站,你可以直接在那里使用它,或者下载它到另一个云平台,或在自己的计算机上运行。如果它足够小,你可以在你的PC上运行,运行你的工作站,运行你的数据中心。我们将使这些NIMs的性能非常高效。所以,这是使用英伟达库的一种新方式,当你作为一个企业运行这些库。