橘子百科-橘子都知道橘子百科-橘子都知道

好好记住我在你体内的感觉

好好记住我在你体内的感觉 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮(cháo)”最大赢家之(zhī)一、英伟达背(bèi)后的那个(gè)身穿黑色(sè)皮衣的男人(rén)又来了。

  前脚才交出亮眼业绩狂拉股价(jià),英伟(wěi)达(dá)CEO黄仁勋后脚就在昨日的COMPUTEX大(dà)会上宣布,“我们已到(dào)达生(shēng)成式AI引爆点。从此,全(quán)世界的每个角落,都(dōu)会有计算需求(qiú)。”

  如今英伟达(dá)掌(zhǎng)握着全球(qiú)多(duō)家科技公司(sī)“算力(lì)命(mìng)脉”,而在(zài)这场(chǎng)大(dà)会上,黄仁勋(xūn)激情演讲2个小时,甩出(chū)了(le)多项重磅新发布,包括算(suàn)力“杀(shā)器”DGX GH200超级计算机、针对游戏的ACE代工服务、MGX服务器规范(fàn)等内容。

  算力“杀器(qì)”:DGX GH200超(chāo)级计算(suàn)机(jī)+GH200超级芯(xīn)片(piàn)

  先看“集(jí)成了英伟达(dá)最先进加速计算和网络技术”的DGX GH200人工智能超级计算机

  这(zhè)款超算专为(wèi)大规模生成(chéng)式AI的负载所设(shè)计,由(yóu)256块GH200超(chāo)级芯片组成,拥有1 exaflop超凡(fán)AI性(xìng)能、144TB内(nèi)存(cún)(是英伟达目前DGX A100系统的近(jìn)500倍)、150英里光(guāng)纤(xiān)、2000多(duō)个风(fēng)扇。

  DGX GH200重达40000磅(约合18143千克),堪比四只成年大象(xiàng)的(de)体重。

  预计(jì)DGX GH200将(jiāng)于(yú)今年(nián)年底投入(rù)问(wèn)世,英伟(wěi)达(dá)暂未公布价格(gé),而(ér)谷歌云、Meta与微软将(jiāng)是首批(pī)用(yòng)户(hù)

  同时,英(yīng)伟(wěi)达(dá)也正在(zài)打造自家基于DGX GH200的大型AI超级(jí)计算机NVIDIA Helios,以支持其研(yán)究(jiū)和开发团队(duì)的工作。其中采用4个DGX GH200系统(tǒng)、1024颗Grace Hopper超(chāo)级(jí)芯片(piàn),每个都将与英伟达Quantum-2 InfiniBand网络连接,带宽高(gāo)达400Gb/s,将于(yú)今年年(nián)底(dǐ)上线。

  值得(dé)一提(tí)的是,黄(huáng)仁勋(xūn)透露(lù),DGX GH200集成的GH200 Grace Hopper超级芯片已进入全面(miàn)生(shēng)产

  “拉(lā)踩”CPU:成(chéng)本、功耗、处(chù)理数(shù)据量不如GPU

  在(zài)本(běn)次大会上,黄(huáng)仁勋还“拉(lā)踩”了(le)一波CPU。他从(cóng)功耗、处理数(shù)据量等方面,指出使用GPU胜过CPU。

  举例来说,花费1000万美元,可以建设一个有960颗CPU的数(shù)据(jù)中心(xīn),其可(kě)处理1X LMM(大语言(yán)模型)数据量(liàng),需要11GWh功耗;

  同样成本下,也可以建设一个有48个GPU的(de)数据中心,其可处理44X LLM数据(jù)量,仅需要3.2GWh功(gōng)耗(hào)。

  若只想处理1X LMM数据量,则只需(xū)40万美(měi)元,便可拥有一个搭载(zài)2个GPU、功耗仅0.13GWh的(de)数据中(zhōng)心。

  “买越多,省越多(The more you buy, the more you save)。”黄(huáng)仁勋再(zài)次表(biǎo)示。

  同(tóng)时,他也(yě)列出了数据中心成(chéng)本(běn)公式(shì):数据中(zhōng)心总(zǒng)持有(yǒu)成(chéng)本=f[成本(běn)(芯(xīn)片、系(xì)统、硬件(jiàn)生(shēng)态系统)、吞吐量(GPU、Algo软件、网络、系统软件、软件生态系统)、使用(yòng)率(Algo Lib, 软(ruǎn)件生态系统)、采购运(yùn)营、生命周期最佳化、电力(lì)]

  ACE代工(gōng)服务:用AI激活(huó)NPC生命

  游戏一直是(shì)备受(shòu)关(guān)注的一大AI应用落地领域。英伟达(dá)也在大会上(shàng)宣布,推出面向(xiàng)游戏(xì)的(de)定制AI模型代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非(fēi)玩家角色(sè)(NPC)更智(zhì)能且不断进化的对话技能,中间件、工(gōng)具和(hé)游戏开发者可使用(yòng)它来构建和部署定制的语音、对话和动画AI模(mó)型

  其中包括(好好记住我在你体内的感觉kuò):英伟达NeMo,使用(yòng)专有数据构(gòu)建、定制和(hé)部署语言模型;英伟达(dá)Riva,用于自(zì)动语音识(shí)别和文本(běn)转语(yǔ)音实(shí)现实时语音对话(huà);英伟达Omniverse Audio2Face,用(yòng)于即时创(chuàng)建游戏(xì)角色表(biǎo)情动画,以匹配任何(hé)语(yǔ)音轨道。

  开发人(rén)员可选择(zé)集成整个NVIDIA ACE for Games解决方案,也可仅使用需(xū)要的组(zǔ)件。

  新参考(kǎo)工作(zuò)流程:帮助建(jiàn)设数字化智(zhì)能工(gōng)厂

  黄仁(rén)勋表(biǎo)示(shì),全球电子制(zhì)造商正在(zài)使用一种全新(xīn)的综合(hé)参(cān)考工作流程推进工业(yè)数字化(huà)工作(zuò),该工作(zuò)流程结合(hé)了英(yīng)伟(wěi)达用于(yú)生成式AI、3D协作、仿真和自主机器的技(jì)术,包括:

  英伟达Omniverse,其连(lián)接了顶级计算机辅助设(shè)计应(yīng)用(yòng)以及生成式AI的(de)API和前沿框架;用(yòng)于模拟和(hé)测试机器人的英伟达Isaac Sim应用程序;英伟达Metropolis视(shì)觉(jué)AI框架,用于自动光学检测。

  同时(shí),黄仁(rén)勋(xūn)现场(chǎng)展(zhǎn)示了(le)一个完全(quán)数字化的(de)智能工(gōng)厂(chǎng)的演示。

  目前(qián)富士(shì)康工业互联网、宜鼎国际、和硕、广达(dá)和纬创正在(zài)使用这一参考(kǎo)工作(zuò)流程(chéng),具体用例包(bāo)括电路(lù)板质(zhì)保检测点自动化、光学检测(cè)自动(dòng)化(huà)、建设虚拟(nǐ)工厂(chǎng)、模拟(nǐ)协作机器人、构建及运营(yíng)数字孪(luán)生等。

  MGX服务器规(guī)范:快速高效构(gòu)建百(bǎi)余(yú)种服(fú)务器(qì)配(pèi)置(zhì)

  英(yīng)伟达发布NVIDIA MGX服务器规范,为(wèi)系统制造商提供模块(kuài)化参考架构,满(mǎn)足各(gè)种规模(mó)的数据中心需求。系统制造商可使(shǐ)用它快(kuài)速且(qiě)经济(jì)高效(xiào)地构建100多种服务(wù)器配置,以适应广泛(fàn)的AI、HPC及(jí)NVIDIA Omniverse应用。

  MGX支持英(yīng)伟达全(quán)系(xì)列GPU、CPU、DPU和(hé)网络适配器、各种x86、完整(zhěng)软件堆栈及(jí)Arm处理器,还(hái)可集(jí)成到云和企(qǐ)业数(shù)据中心中(zhōng)。

  华硕、和(hé)硕、QCT、超微(wēi)(Supermicro)等都将(jiāng)采(cǎi)用MGX构建下一代(dài)加(jiā)速计算机(jī),可将开发(fā)成本削减多(duō)达3/4,并(bìng)将开发时间缩短2/3至仅(jǐn)需6个月

  其中(zhōng),QCT和超微基于MGX的设计将于(yú)8月(yuè)面世(shì)。超微昨日公布的ARS-221GL-NR系统将采用(yòng)Grace CPU,而(ér)QCT的S74G-2U系统将采用Grace Hopper。

  推出(chū)Spectrum-X网络(luò)平台 构建(jiàn)超(chāo)大规模生成(chéng)式AI超级(jí)计算机(jī)Israel-1

  另(lìng)外,黄仁勋宣布推出NVIDIA Spectrum-X网络平台(tái),旨在提高(gāo)基于以太网的(de)AI云的(de)性能和效率。

  相比传统以太网结(jié)构,Spectrum-X可实现1.7倍的整体AI性能和能效提升(shēng),并具有高度通用性,可用于各种AI应用。它使用完(wán)全基(jī)于标准(zhǔn)的以太(tài)网,并可与基(jī)于(yú)以(yǐ)太网的堆(duī)栈互操作(zuò)。该平台支持256个200Gb/s端口(kǒu),通过单个交换机连(lián)接(jiē),或在两(liǎng)层leaf-spine拓扑中提供(gōng)16000个端口,以支持AI云增长和扩展,在保持性(xìng)能的同时最大限度减少网络(luò)延迟(chí)。

  全球领先云(yún)计算提供商正(zhèng)在采用Spectrum-X平台(tái)扩展生成式(shì)AI服务,而(ér)Spectrum-X、Spectrum-4交(jiāo)换(huàn)机、BlueField-3 DPU等已在戴尔、联(lián)想等系(xì)统制造商处提(tí)供(gōng)。

  此(cǐ)外,作为Spectrum-X参(cān)考设计(jì)的蓝图和(hé)测试(shì)平台,英伟达正构建一台超大(dà)规模(mó)生成式AI超级计算机Israel-1。这台AI超(chāo)算价值(zhí)数亿美元,将(jiāng)采(cǎi)用戴尔PowerEdge XE9680服务器、英伟(wěi)达HGX H100超级计算平(píng)台(tái)、内置(zhì)BlueField-3 DPU和Spectrum-4交(jiāo)换机的Spectrum-X平(píng)台(tái)。

  结语

  “40年(nián)来,我们创造了PC、互联网、移动、云,现(xiàn)在是(shì)人工智能时代(dài)。你会创造什(shén)么?不管是什么,都要像我们一样追赶它。要(yào)奔跑,不要走。要么为了食(shí)物奔跑,要么作为食物奔跑(pǎo)。”

  在5月27日(rì)的台湾大学发表了(le)毕业典礼演讲上,黄仁勋再次(cì)强调了掌(zhǎng)握AI技术的重(zhòng)要性:很多(duō)人担心,AI会抢走自己(jǐ)的工作。但真正会(huì)抢走你饭(fàn)碗的(de),是掌握了AI技术的(de)人。

  他表示,从各方面来看,AI的(de)兴(xīng)盛是计算(suàn)机产业(yè)的再生(shēng)契机(jī)。在下个十年(nián),我们的产业将使用新型AI电脑,取代价值万(wàn)亿(yì)美(měi)元的传统电脑(nǎo)。

  而(ér)从昨(好好记住我在你体内的感觉zuó)日大会上黄仁勋(xūn)的展示中,人(rén)工智能时代的未来轮廓(kuò)似(shì)乎(hū)已逐(zhú)渐浮现。

未经允许不得转载:橘子百科-橘子都知道 好好记住我在你体内的感觉

评论

5+2=