好好记住我在你体内的感觉-橘子百科-橘子都知道

好好记住我在你体内的感觉 “AI春晚”英伟达放大招：亮算力“杀器”、助游戏“捏人”；黄仁勋帮算账：GPU多买多省

　　“AI热潮(cháo)”最大赢家之(zhī)一、英伟达背(bèi)后的那个(gè)身穿黑色(sè)皮衣的男人(rén)又来了。

　　前脚才交出亮眼业绩狂拉股价(jià)，英伟(wěi)达(dá)CEO黄仁勋后脚就在昨日的COMPUTEX大(dà)会上宣布，“我们已到(dào)达生(shēng)成式AI引爆点。从此，全(quán)世界的每个角落，都(dōu)会有计算需求(qiú)。”

　　如今英伟达(dá)掌(zhǎng)握着全球(qiú)多(duō)家科技公司(sī)“算力(lì)命(mìng)脉”，而在(zài)这场(chǎng)大(dà)会上，黄仁勋(xūn)激情演讲2个小时，甩出(chū)了(le)多项重磅新发布，包括算(suàn)力“杀(shā)器”DGX GH200超级计算机、针对游戏的ACE代工服务、MGX服务器规范(fàn)等内容。

　　算力“杀器(qì)”：DGX GH200超(chāo)级计算(suàn)机(jī)+GH200超级芯(xīn)片(piàn)

　　先看“集(jí)成了英伟达(dá)最先进加速计算和网络技术”的DGX GH200人工智能超级计算机。

　　这(zhè)款超算专为(wèi)大规模生成(chéng)式AI的负载所设(shè)计，由(yóu)256块GH200超(chāo)级芯片组成，拥有1 exaflop超凡(fán)AI性(xìng)能、144TB内(nèi)存(cún)（是英伟达目前DGX A100系统的近(jìn)500倍）、150英里光(guāng)纤(xiān)、2000多(duō)个风(fēng)扇。

　　DGX GH200重达40000磅（约合18143千克），堪比四只成年大象(xiàng)的(de)体重。

　　预计(jì)DGX GH200将(jiāng)于(yú)今年(nián)年底投入(rù)问(wèn)世，英伟(wěi)达(dá)暂未公布价格(gé)，而(ér)谷歌云、Meta与微软将(jiāng)是首批(pī)用(yòng)户(hù)。

　　同时，英(yīng)伟(wěi)达(dá)也正在(zài)打造自家基于DGX GH200的大型AI超级(jí)计算机NVIDIA Helios，以支持其研(yán)究(jiū)和开发团队(duì)的工作。其中采用4个DGX GH200系统(tǒng)、1024颗Grace Hopper超(chāo)级(jí)芯片(piàn)，每个都将与英伟达Quantum-2 InfiniBand网络连接，带宽高(gāo)达400Gb/s，将于(yú)今年年(nián)底(dǐ)上线。

　　值得(dé)一提(tí)的是，黄(huáng)仁勋(xūn)透露(lù)，DGX GH200集成的GH200 Grace Hopper超级芯片已进入全面(miàn)生(shēng)产。

　　“拉(lā)踩”CPU：成(chéng)本、功耗、处(chù)理数(shù)据量不如GPU

　　在(zài)本(běn)次大会上，黄(huáng)仁勋还“拉(lā)踩”了(le)一波CPU。他从(cóng)功耗、处理数(shù)据量等方面，指出使用GPU胜过CPU。

　　举例来说，花费1000万美元，可以建设一个有960颗CPU的数(shù)据(jù)中心(xīn)，其可(kě)处理1X LMM（大语言(yán)模型）数据量(liàng)，需要11GWh功耗；

　　同样成本下，也可以建设一个有48个GPU的(de)数据中心，其可处理44X LLM数据(jù)量，仅需要3.2GWh功(gōng)耗(hào)。

　　若只想处理1X LMM数据量，则只需(xū)40万美(měi)元，便可拥有一个搭载(zài)2个GPU、功耗仅0.13GWh的(de)数据中(zhōng)心。

　　“买越多，省越多（The more you buy， the more you save）。”黄(huáng)仁勋再(zài)次表(biǎo)示。

　　同(tóng)时，他也(yě)列出了数据中心成(chéng)本(běn)公式(shì)：数据中(zhōng)心总(zǒng)持有(yǒu)成(chéng)本=f[成本(běn)（芯(xīn)片、系(xì)统、硬件(jiàn)生(shēng)态系统）、吞吐量（GPU、Algo软件、网络、系统软件、软件生态系统）、使用(yòng)率（Algo Lib，软(ruǎn)件生态系统）、采购运(yùn)营、生命周期最佳化、电力(lì)]。

　　ACE代工(gōng)服务：用AI激活(huó)NPC生命

　　游戏一直是(shì)备受(shòu)关(guān)注的一大AI应用落地领域。英伟达(dá)也在大会上(shàng)宣布，推出面向(xiàng)游戏(xì)的(de)定制AI模型代工服务NVIDIA Avatar Cloud Engine（ACE）。

　　它能赋予非(fēi)玩家角色(sè)（NPC）更智(zhì)能且不断进化的对话技能，中间件、工(gōng)具和(hé)游戏开发者可使用(yòng)它来构建和部署定制的语音、对话和动画AI模(mó)型。

　　其中包括(好好记住我在你体内的感觉kuò)：英伟达NeMo，使用(yòng)专有数据构(gòu)建、定制和(hé)部署语言模型；英伟达(dá)Riva，用于自(zì)动语音识(shí)别和文本(běn)转语(yǔ)音实(shí)现实时语音对话(huà)；英伟达Omniverse Audio2Face，用(yòng)于即时创(chuàng)建游戏(xì)角色表(biǎo)情动画，以匹配任何(hé)语(yǔ)音轨道。

　　开发人(rén)员可选择(zé)集成整个NVIDIA ACE for Games解决方案，也可仅使用需(xū)要的组(zǔ)件。

　　新参考(kǎo)工作(zuò)流程：帮助建(jiàn)设数字化智(zhì)能工(gōng)厂

　　黄仁(rén)勋表(biǎo)示(shì)，全球电子制(zhì)造商正在(zài)使用一种全新(xīn)的综合(hé)参(cān)考工作流程推进工业(yè)数字化(huà)工作(zuò)，该工作(zuò)流程结合(hé)了英(yīng)伟(wěi)达用于(yú)生成式AI、3D协作、仿真和自主机器的技(jì)术，包括：

　　英伟达Omniverse，其连(lián)接了顶级计算机辅助设(shè)计应(yīng)用(yòng)以及生成式AI的(de)API和前沿框架；用(yòng)于模拟和(hé)测试机器人的英伟达Isaac Sim应用程序；英伟达Metropolis视(shì)觉(jué)AI框架，用于自动光学检测。

　　同时(shí)，黄仁(rén)勋(xūn)现场(chǎng)展(zhǎn)示了(le)一个完全(quán)数字化的(de)智能工(gōng)厂(chǎng)的演示。

　　目前(qián)富士(shì)康工业互联网、宜鼎国际、和硕、广达(dá)和纬创正在(zài)使用这一参考(kǎo)工作(zuò)流程(chéng)，具体用例包(bāo)括电路(lù)板质(zhì)保检测点自动化、光学检测(cè)自动(dòng)化(huà)、建设虚拟(nǐ)工厂(chǎng)、模拟(nǐ)协作机器人、构建及运营(yíng)数字孪(luán)生等。

　　MGX服务器规(guī)范：快速高效构(gòu)建百(bǎi)余(yú)种服(fú)务器(qì)配(pèi)置(zhì)

　　英(yīng)伟达发布NVIDIA MGX服务器规范，为(wèi)系统制造商提供模块(kuài)化参考架构，满(mǎn)足各(gè)种规模(mó)的数据中心需求。系统制造商可使(shǐ)用它快(kuài)速且(qiě)经济(jì)高效(xiào)地构建100多种服务(wù)器配置，以适应广泛(fàn)的AI、HPC及(jí)NVIDIA Omniverse应用。

　　MGX支持英(yīng)伟达全(quán)系(xì)列GPU、CPU、DPU和(hé)网络适配器、各种x86、完整(zhěng)软件堆栈及(jí)Arm处理器，还(hái)可集(jí)成到云和企(qǐ)业数(shù)据中心中(zhōng)。

　　华硕、和(hé)硕、QCT、超微(wēi)（Supermicro）等都将(jiāng)采(cǎi)用MGX构建下一代(dài)加(jiā)速计算机(jī)，可将开发(fā)成本削减多(duō)达3/4，并(bìng)将开发时间缩短2/3至仅(jǐn)需6个月。

　　其中(zhōng)，QCT和超微基于MGX的设计将于(yú)8月(yuè)面世(shì)。超微昨日公布的ARS-221GL-NR系统将采用(yòng)Grace CPU，而(ér)QCT的S74G-2U系统将采用Grace Hopper。

　　推出(chū)Spectrum-X网络(luò)平台构建(jiàn)超(chāo)大规模生成(chéng)式AI超级(jí)计算机(jī)Israel-1

　　另(lìng)外，黄仁勋宣布推出NVIDIA Spectrum-X网络平台(tái)，旨在提高(gāo)基于以太网的(de)AI云的(de)性能和效率。

　　相比传统以太网结(jié)构，Spectrum-X可实现1.7倍的整体AI性能和能效提升(shēng)，并具有高度通用性，可用于各种AI应用。它使用完(wán)全基(jī)于标准(zhǔn)的以太(tài)网，并可与基(jī)于(yú)以(yǐ)太网的堆(duī)栈互操作(zuò)。该平台支持256个200Gb/s端口(kǒu)，通过单个交换机连(lián)接(jiē)，或在两(liǎng)层leaf-spine拓扑中提供(gōng)16000个端口，以支持AI云增长和扩展，在保持性(xìng)能的同时最大限度减少网络(luò)延迟(chí)。

　　全球领先云(yún)计算提供商正(zhèng)在采用Spectrum-X平台(tái)扩展生成式(shì)AI服务，而(ér)Spectrum-X、Spectrum-4交(jiāo)换(huàn)机、BlueField-3 DPU等已在戴尔、联(lián)想等系(xì)统制造商处提(tí)供(gōng)。

　　此(cǐ)外，作为Spectrum-X参(cān)考设计(jì)的蓝图和(hé)测试(shì)平台，英伟达正构建一台超大(dà)规模(mó)生成式AI超级计算机Israel-1。这台AI超(chāo)算价值(zhí)数亿美元，将(jiāng)采(cǎi)用戴尔PowerEdge XE9680服务器、英伟(wěi)达HGX H100超级计算平(píng)台(tái)、内置(zhì)BlueField-3 DPU和Spectrum-4交(jiāo)换机的Spectrum-X平(píng)台(tái)。

　　结语

　　“40年(nián)来，我们创造了PC、互联网、移动、云，现(xiàn)在是(shì)人工智能时代(dài)。你会创造什(shén)么？不管是什么，都要像我们一样追赶它。要(yào)奔跑，不要走。要么为了食(shí)物奔跑，要么作为食物奔跑(pǎo)。”

　　在5月27日(rì)的台湾大学发表了(le)毕业典礼演讲上，黄仁勋再次(cì)强调了掌(zhǎng)握AI技术的重(zhòng)要性：很多(duō)人担心，AI会抢走自己(jǐ)的工作。但真正会(huì)抢走你饭(fàn)碗的(de)，是掌握了AI技术的(de)人。

　　他表示，从各方面来看，AI的(de)兴(xīng)盛是计算(suàn)机产业(yè)的再生(shēng)契机(jī)。在下个十年(nián)，我们的产业将使用新型AI电脑，取代价值万(wàn)亿(yì)美(měi)元的传统电脑(nǎo)。

　　而(ér)从昨(好好记住我在你体内的感觉zuó)日大会上黄仁勋(xūn)的展示中，人(rén)工智能时代的未来轮廓(kuò)似(shì)乎(hū)已逐(zhú)渐浮现。

未经允许不得转载：橘子百科-橘子都知道好好记住我在你体内的感觉