4 月 17 日,英伟达 CEO 黄仁勋(Jensen Huang)参加了 Cadence 举办的活动,对话 CadenceCEOAnirudh Devgan,讨论了 AI 与加速计算在塑造行业大趋势方面的关键作用,以及英伟达与 Cadence 如何合作推动 EDA、SDA、数字生物学和 AI 领域的转型变革。
黄仁勋表示,AI正引领计算力的巨大飞跃,是计算转型的最集中体现。生成式AI能实现比加速计算更高几个数量级的计算能力提升,AI 将在数据中心、机器人/自动驾驶、生命科学三个领域带来革命性影响。
关于能源消耗,黄仁勋认为,虽然 AI 消耗大量计算能力,但通过 AI 优化设计,最终将大幅节省整个社会的能源消耗,AI 会是应对气候变化的重要手段。
关于企业管理以及研发,黄仁勋表示,AI 工具将使工程师从繁重的劳动中解放出来,专注于创新设计,提高生产力这正是Nvidia组织文化和管理理念的核心原则。以下为这次对话全部内容:
就 AI 而言,你拥有推动这些创新的前排座位。你看到未来五年会发生什么?这些模型变得更大,模型变得更具体。架构、数据中心会发生什么?你对下一个五年有什么看法?
可能是计算转型的最浓缩的例子。正如你所知,计算平台的基本变化,过渡,它是周期的基础,它是每一个依赖周期性行业的基础,影响每一个行业。
正在发生的事情,如果你看你的主题演讲,一旦你开始使用加速计算,接下来可能的事情就是,生成式 AI 是在此基础上增加的,没有过渡到加速计算,生成式 AI 将非常难以实现。
转向加速计算的好处是突然之间,过去使用 CPU 扩展时难以扩展的东西,突然你谈论的是1000倍的X因子,在那之上还有另一个 30 倍的 X 因子。在那之上,当你添加生成式 AI 时,还有另一个十万倍的因子。
你在开始时说,设计工具完成了一次处理,但设计师想做的是探索一个多维、多模态的,通常是探索空间。没有正确答案。只有一个最好的答案。所以我们需要探索数十万种不同的领域。
但当然,宇宙,设计的穷尽性探索太困难了。无限的计算量也无法做到。所以我们需要 AI 帮助我们跳入特定的探索和优化领域,然后使用主要求解器真正地集中在那里。所以我们可以一起做很多不同的事情。所以,加速计算首先将改变 Cadence 开发软件的方式,它将改变我们使用软件的方式,这是第一点。
除了能够做好之外,还有几个好处。我们设计我们的电路、我们的芯片、我们的PCB、我们的系统,现在甚至是我们的数据中心,在 Cadence 中,你非常清楚这一点。我们使用你进行电路设计、逻辑设计、系统设计、仿真、验证、形式验证等等,端到端,一直到流体。所以现在的设计空间不再是关于一个芯片或一个系统,而是真正跨越整个事物的共同设计。
Millennium 真的是一个很好的例子,因为你本质上是一个共同设计公司。计算机科学行业、计算机行业谈论它的方式,我们在工程中谈论它的方式是共同设计,而在计算中谈论它的方式叫做全栈,但这是同一个想法,你必须在整个事物上进行创新。所以你的转型,从芯片设计、EDA 公司到 EDA SDA 公司,是非常有远见的,也是非常必要的。这正是我们与 Cadence 合作的方式,也是我们设计系统的方式。
一些人们开始意识到的领域,你的主题演讲实际上非常好,我建议每个人都再看几次,因为它非常密集,它非常密集。
不管怎样,你提到的一个领域非常深刻,那就是通过投资加速计算、投资 AI 、投资数据中心,我们能够设计出更好、更节能的产品。
现在记住,你设计芯片只设计一次,但你将运送万亿次。你建立数据中心一次,但你节省电力,你在媒体技术中展示的 6% 的电力节省,这 6% 将被十亿人整天享受。因此,通过设计更好的软件、更好的船舶、更好的系统,我们将能够为世界节省能源,这对社会有永久的好处。
一方面,我们将为 AI 消耗更多的电力和数据中心的电力。另一方面,对于消耗和能源消耗的 98%,我们将减少这一点,设计更好的产品,设计更好的计算机、更好的汽车、更好的手机,等等,更好的材料等等。
我们正处于一个非常,人们称之为一个拐点,一个过渡。所有这些都是完全正确的。这是一个非常激动人心的时刻,你的主题演讲真的突出了这一点。
你谈论了这种转型,不仅仅是制造芯片,因为人们会感到困惑,当然, Nvidia 正在制造最好的芯片。甚至你在 GTC 上的关键词汇,是构建整个数据中心,非常完整的系统,整个软件栈,把它们放在一起。你有架子和液体冷却数据中心。所以整个架构,这不是一个典型的芯片公司的简单转型。
印度已经变成了一个完整的软件系统公司,所以我很好奇,你是如何做到的,或者你总是有这个想法?或者它是如何展开的,这非常难以实施。
现在一些公司正在尝试,系统公司正在尝试制造芯片,这很困难。但 Nvidia 已经完美地执行了这一转型,从不仅仅是芯片到系统到软件到数据,所以我很好奇你是如何开始这样的事情的。
我做芯片设计师已经很久了。这是我整个职业生涯。有一些事情我们很久以前就观察到了,结果证明是正确的。
第一件事是要观察到程序中一小部分代码代表了其运行时间的绝大部分。例如,CFD,可能是 3% 的代码代表了 99.9999% 的运行时间。如果是这样,你为什么要使用完全相同的工具、相同的仪器、相同的处理器来处理所有 90%、全部 100% 的代码?你为什么不为 97% 的代码做一些事,然后为 3% 的代码做一些特别的事情,通过这样做,你可以将 App加速 10 万倍。这是观察到的。当然,需要这种好处并愿意重写的 App类型非常少。
我们很聪明地选择了计算机图形学作为我们的第一个加速计算选择,因为事实证明它是一个非常需要大量并行计算的 App。它有利于并行处理,而且也是一个非常大的市场,市场变化非常快,创新非常快。所以我们选择了一个很好的市场作为起点。但我们总是想象,在计算机图形学之外,还会有一大堆其他的 App出现。
加速计算不像通用计算。在通用计算中,你可以创建一个处理器,它可以运行所有代码。在加速计算中绝对不是这样,因为我创造了“加速计算”这个词。我所说的是,你加速一个 App,它是一个 App加速计算平台,你必须知道是什么 App。所以在 Nvidia 的情况下,我们从选择计算机图形学开始,但我们也做了成像,然后我们做了分子动力学。我很高兴看到你们在数字生物学方面的工作。
顺便说一下,就像一个快速的,今天我们称之为药物发现。我们之所以称之为药物发现。你能想象如果芯片设计行业被称为芯片发现行业吗?
原因是因为工程团队会上来,有机会看看我们发现了 Blackwell 。然后明年就像干旱一样,今年又怎么了?我们没有发现它,这完全合理。但是我们永远不会这样做。不是吗?
原因是生物学要复杂得多。我们塑造一个晶体管,直到我们可以使用设计工具。你不能塑造生物学,直到你可以使用设计工具。你需要设计工具来追赶生物学,这就近了。
世界上最大的产业之一将变成一个 Cadence 产业,而不是你提到的 9%,前面有一个巨大的机会。每一个产业,你提到的生物学,运输业。所有的 App都是不同的。有些与成像有关,有些与粒子物理学有关,有些与流体有关,有些与你知道的有限元有关。你写网格之类的东西。所以算法是不同的。
Cadence 是一个数学和计算公司,在很多方面, Nvidia 也是一个数学和计算公司。完全正确。这就是为什么我们相处得这么好。而且,当 Andrew 和我聚在一起时,我们对彼此说的话,我们很快就明白了。
当你看到我们两个人时,我们在一家餐厅,我们在谈论所有这些未来的事情。我们中的一个人像这样,另一个人像那样。那是因为我们彼此同意。一旦我像这样,他像那样,那我们就麻烦了。
无论如何,我们总是关于特定领域的加速。在 30 年的时间里,我们在一个名为 CUDA 的架构上积累了所有这些不同的 DSL,特定领域的库,有些是每个粒子的,有些是成像的,有些是 AI 等等。
你在 GTC 上做了一个很棒的演讲,这非常了不起。正如我告诉 Jensen 的,他下次需要一个更大的体育场。那个巨大的体育场没有足够的空间。所以下次你可能在 Vegas 或任何你要去的地方。但是你突出了这么多 App,有水平使几乎所有行业都能启用。但然后有一些行业的影响可能会很大,就像你提到的生命科学,但你也谈到了机器人技术,或自动驾驶。那么是否有一个或两个,你对短期内或中期内最兴奋的,具有最大潜力的影响?
你提到的几个行业恰好也是我非常兴奋的三个行业。其中之一是数据中心或仅仅是计算。第二个是,你提到了汽车,但如果我可以将汽车抽象为机器人,自主机器。自主系统或半自主系统,那个大类别,无论是汽车还是卡车,还是披萨送货机器人或仿人机器人,自行机器人,这些系统有很多共同点。它们都需要有多个传感器,需要功能安全非常重要。
你设计计算机和验证计算机,验证计算机,认证计算机的方式非常重要,操作系统不是你正常的操作系统。这些操作系统是我们的故障安全操作系统。所以你设计系统的方式非常细致和具体。
当然, AI 的使用非常昂贵。这些系统将始终连接到云,连接到数据中心,以便它当然可以更新新的经验,报告故障和新情况,然后下载新模型。
我喜欢整个自主系统领域,我们所有人在不久的将来将要构建的一整类新设备将是仿人机器人,你可以预见到仿人机器人的制造成本可能比人们预期的要低得多。为什么它比1 ~2 万美元还要多?你买汽车是1~2 万美元。为什么你不能有一个 1~2 万美元的人类或机器人?机器人很可能在一个为我们设计的环境中,在人类设计的世界中,比人类更灵活、更多功能。因此,装配线是为人类设计的,仓库是为人类设计的,很多事情都是为人类设计的,所以仿人机器人很可能在那种环境中更有生产力。
我喜欢我们将把生物学变成一个工程领域。科学发现过程非常重要,但它是零星的。这就是为什么厄姆定律是正确的。顺便说一下,如果我们不转向加速计算,如果我们不去 AI ,计算机行业将经历厄姆定律。
原因非常清楚。我们做的工作量,我们做的计算量一直在增长。但 CPU 扩展已经放缓,因此我们将享受计算成本的通胀而不是减少。因此,我们必须转向加速计算以节省电力、节省时间、节省金钱。
无论如何,数字生物学将经历一场全面的复兴,科学和工程越来越接近。这是一个非常复杂的领域。显然,我们在芯片设计中不谈论薛定谔方程,因为我们改变了晶体管,直到我们可以避免薛定谔方程。
不幸的是,在生物学中,共价键,化学的工作方式,显然薛定谔方程是必要的。所以我们有很多需要创新的东西。但第一次,我们有必要的工具,计算系统,算法,帮助我们处理非常大且非常混乱的系统,数据驱动的方法与你之前所说的原则性,原则性模拟方法的融合,这种融合可能会给我们一个机会。
因为无论如何,汽车将像自动驾驶一样,可能是第一个机器人技术,但然后仿人机器人是另一个。最近在生物和现实中,在数据中心,所以那里有一个大问题,即电力使用。
由 Cadence 设计我们的数据中心,现在一台计算机就是整个数据中心。
你对 AI 所消耗的电力,数据中心所消耗的电力有什么看法?当然我们可以优化,但是我们还能做些什么?其中一种方法是如果你做更多的加速计算。实际上,人们没有意识到你的电力利用率肯定会下降。你对 AI 和数据中心的电力消耗有什么看法?
你刚才说的第一件事绝对是真的,加速计算的电力使用量非常高。原因是因为计算机非常密集,所以电力消耗很高。我们对电力利用率所做的任何优化都直接转化为更多的性能。
这种性能可以衡量为,更多的生产力,产生更多的收入,或者直接转化为相同性能的节省。你可以买一个更小的东西,好吗?加速计算中的电力管理直接转化为你所关心的所有事情。我刚说了一些看起来正确的观察。
实际上,你刚才说的第二件事会暗示它实际上完全是错误的。而我们所说的,以及任何根源的含义是,加速计算,正如你在演示中看到的,用数万台通用服务器,它们会消耗 10~20 倍的能量,成本是 20~30 倍,减少到一个非常密集的东西。
因此,加速计算的密度是人们认为它耗电和成本高昂的原因。但如果你用每个 ISO 工作完成或 ISO 吞吐量来看待它,实际上,你节省了大量的金钱。这就是为什么 CPU 扩展已经放缓,我们必须转向加速计算,因为你不能继续以传统的方式进行扩展。因此,加速计算是必要的。
你在主题演讲中强调的第二件事,必须非常仔细地注意。AI 实际上帮助人们节省能源,如果没有你创建的我们现在在工具中使用的 AI 模型,我们将如何找到 6% 的更多节省或 10 倍的更多节省,这在没有 AI 的情况下是不可能的?
你投资一次模型的训练,然后像我们这样的数百万工程师可以受益,数十亿人将能够在数十年中享受节省,这就是思考成本的方式,思考投资的方式,不仅仅是在实例基础上,而是在医疗保健方面,你必须纵向地看待节省,看待气候变化,看待金钱节省,能源节省,纵向地看待整个跨度,不仅仅是你正在建造的产品,而是你设计的产品的方式,以及产品使用的影响。当你像那样纵向地看待它时, AI 将非常有助于帮助我们应对气候变化,使用更少的电力,更加节能等等。
Jensen,你还有一种非常独特的管理风格,你的领导风格是众所周知的。飞行组织,快速决策,看到这些真是令人难以置信。而且有很多观众,工程师和经理和领导者。所以你对这些事情有什么建议?如何转变,因为将想法转化为行动。
在视频管理系统和领导哲学的核心,如果你愿意,是创造条件,让了不起的人可以做他们一生的工作。我只是描述了一个哲学,一个使命宣言,如果你愿意,以及我自己和领导者的行为方式。所以问题是,我们能做些什么来创造条件,让人们可以做他们一生的工作?
最重要的一个方面是赋予他们信息的力量。所以我不认为我做出的任何决定只有一个人需要听到它,或者我需要在一对一的基础上向某人耳语一些信息,因为其他人不配听到它或不能听到它,或者,太难以听到或无论它是什么。所以我倾向于在大型环境中做我的大部分工作,那里有一个多样化的专家团队和贡献者聚集在一起,我们只是解决问题,我们只是解决问题。所以这是第一点。
我还喜欢除了公司的挑战和人们应该获得的信息的透明度之外,我还喜欢有机会在人们面前推理事情。这迫使我们提出建议,这些建议的方向基本上是建立在良好的推理上。所以通过强迫自己推理事情,我做了两件事。当然,我正在影响他人。第二,教其他人如何推理,以及将一个非常复杂、抽象的想法推理到我们确切应该做什么的能力。
我们现在为什么应该这样做,或者现在不应该这样做,大多数时候是关于现在不这样做。我们根本不做这件事。这个推理过程对人们来说是非常赋权的,所以这就是 Nvidia 如此之小的原因之一。
我们只有 2.8 万人,但我们的打击力远远超出了我们的体重,因为几乎每个人都被赋予了代表我做出好的、基于推理的、原则性的、第一原则的决策的能力。所以这就是我们做我们所做的事情的原因。
最后,你的组织属性应该反映你制造的产品。Nvidia 是一家全栈公司,我们是完整的,我们就像你一样,我们完全共同设计。
共同设计意味着你不应该只与硬件团队一起做某事。你不应该只与软件团队一起做某事。你应该同时在所有事情上做某事,因为你正在这样做。所以我试图创造一个环境,让公司每个层面的专家和贡献者都能同时参与解决问题,同时参与问题,这些是一些原则。
PS:回顾 2023 年至今,大部分 AI 炒作都集中在基础模型的横向能力上,但 AI 的真正机会在于AI 以及 Agent 如何重新配置与创造 B2B 价值链,112 家顶尖 VC 评选出 2024 年 Top30 科技初创公司,接近 50% GenAI,SaaS 不到 1/4。
Reference:
https://www.youtube.com/watch?v=YUrlLq2CuGM
本文转载自:公众号:有新Newin,不代表爱氧气立场,平台仅提供信息存储空间服务。
本网站属于非赢利性网站,如对本稿件有异议或投诉,请联系(iyangqi@qq.com)爱氧气处理。