橘子百科-橘子都知道橘子百科-橘子都知道

两害相权取其轻,两利相权取其重,两权相害取其轻正确说法是什么意思

两害相权取其轻,两利相权取其重,两权相害取其轻正确说法是什么意思 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大(dà)赢家(jiā)之一(yī)、英伟(wěi)达背后的那个身穿黑(hēi)色(sè)皮衣的(de)男人(rén)又来了。

  前脚才(cái)交(jiāo)出亮眼(yǎn)业(yè)绩(jì)狂拉股价,英(yīng)伟达(dá)CEO黄仁勋后脚就在昨日的(de)COMPUTEX大会上(shàng)宣布,“我们已(yǐ)到达生成式AI引爆点(diǎn)。从此,全(quán)世界的每个角(jiǎo)落,都会有计算(suàn)需求。”

  如今英伟(wěi)达掌(zhǎng)握着全(quán)球多家科技公司(sī)“算(suàn)力(lì)命脉”,而在这场大会上,黄仁勋激情演讲2个小时,甩出了多项(xiàng)重(zhòng)磅新(xīn)发布,包括算力“杀器”DGX GH200超级计(jì)算机、针对游戏的ACE代(dài)工服务、MGX服(fú)务器(qì)规范等内(nèi)容(róng)。

  算力“杀器”:DGX GH200超级(jí)计(jì)算机+GH200超级(jí)芯(xīn)片

  先看“集成了(le)英伟达最先进加速计(jì)算和网络技术”的DGX GH200人工智能超级计算机

  这款(kuǎn)超算专(zhuān)为(wèi)大规模生成式AI的负载所设计,由256块GH200超级芯(xīn)片组成(chéng),拥(yōng)有1 exaflop超凡AI性能、144TB内存(cún)(是(shì)英(yīng)伟达目(mù)前DGX A100系统的(de)近500倍)、150英里光纤、2000多(duō)个风(fēng)扇。

  DGX GH200重达40000磅(约合18143千克),堪比(bǐ)四只成(chéng)年大象的体重。

  预计DGX GH200将于今年年底(dǐ)投入问世,英伟达(dá)暂未(wèi)公布价格,而谷歌(gē)云、Meta与微软将是首批用户

  同时(shí),英伟达也(yě)正在(zài)打造自家(jiā)基于DGX GH200的(de)大型AI超(chāo)级(jí)计算(suàn)机NVIDIA Helios,以支持其研究和开发团(tuán)队(duì)的工作(zuò)。其中采用4个DGX GH200系(xì)统、1024颗Grace Hopper超级芯片,每个都(dōu)将(jiāng)与英伟达Quantum-2 InfiniBand网络连接,带(dài)宽高达400Gb/s,将于今年年(nián)底上线。

  值得一提的是,黄仁勋透露,DGX GH200集成的GH200 Grace Hopper超级(jí)芯片已进入全面(miàn)生(shēng)产

  “拉踩”CPU:成本、功(gōng)耗、处理数据量不如GPU

  在本次大(dà)会上,黄仁(rén)勋还“拉踩”了一波CPU。他从功耗、处理(lǐ)数据(jù)量等方面(miàn),指(zh两害相权取其轻,两利相权取其重,两权相害取其轻正确说法是什么意思ǐ)出使(shǐ)用(yòng)GPU胜过CPU。

  举例来说,花费(fèi)1000万美元,可(kě)以建(jiàn)设一个有960颗CPU的数(shù)据(jù)中心,其可(kě)处理1X LMM(大语言模型)数据量,需要11GWh功耗;

  同样成本下,也可以建设一个有(yǒu)48个GPU的数(shù)据(jù)中(zhōng)心,其可处理44X LLM数据量,仅需要3.2GWh功耗。

  若(ruò)只想处理(lǐ)1X LMM数据量,则只需40万美元,便可拥有一个搭(dā)载2个GPU、功耗仅0.13GWh的数据(jù)中心。

  “买越多,省(shěng)越多(The more you buy, the more you save)。”黄(huáng)仁勋再次表示。

  同时(shí),他也列出了数据中心成本(běn)公式:数据中(zhōng)心(xīn)总(zǒng)持有成本=f[成(chéng)本(芯片、系统、硬件生态系统(tǒng))、吞(tūn)吐量(liàng)(GPU、Algo软件、网络、系统软件(jiàn)、软件生态系统)、使用率(Algo Lib, 软件(jiàn)生态系统)、采购运营、生(shēng)命周期最佳(jiā)化、电(diàn)力(lì)]

  ACE代(dài)工服务(wù):用AI激活(huó)NPC生命

  游戏一直是备(bèi)受关(guān)注的一大AI应用落(luò)地(dì)领域。英伟达(dá)也(yě)在(zài)大(dà)会上宣布,推出面(miàn)向游(yóu)戏的定制AI模型代工服务(wù)NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非玩家角(jiǎo)色(NPC)更智(zhì)能且不断进化的对话(huà)技能,中间件、工具和游戏开发者可使用它来构(gòu)建和部署(shǔ)定制的(de)语音、对话和(hé)动画AI模型

  其中包括(kuò):英伟达NeMo,使用专(zhuān)有数据构建(jiàn)、定制和部署语言模型;英伟达Riva,用(yòng)于自动(dòng)语音识(shí)别和文本(běn)转语音实现实时(shí)语(yǔ)音(yīn)对话;英(yīng)伟达Omniverse Audio2Face,用于即时(shí)创建游(yóu)戏角色(sè)表(biǎo)情动(dòng)画,以匹配任何语音(yīn)轨道。

  开发人员可(kě)选(xuǎn)择集成整个NVIDIA ACE for Games解决(jué)方案(àn),也可仅使用需要的组(zǔ)件。

  新参考工作(zuò)流程:帮助建设数字化(huà)智能工厂

  黄仁(rén)勋表示,全球(qiú)电子(zi)制造商正在使用一种全新的综(zōng)合参考工(gōng)作流程推进工业数(shù)字化(huà)工作,该工作(zuò)流程(chéng)结合了英伟(wěi)达用(yòng)于生成(chéng)式AI、3D协作、仿真和自(zì)主机器的技术,包括:

  英伟达Omniverse,其(qí)连接了顶(dǐng)级计(jì)算机辅助设计应用以及(jí)生成式AI的API和前沿框架;用(yòng)于模拟和测(cè)试机器人的英伟达(dá)Isaac Sim应(yīng)用程序;英伟达Metropolis视觉(jué)AI框架(jià),用(yòng)于自(zì)动光学检测(cè)。

  同时,黄仁勋现场展示(shì)了一个完全数字(zì)化的智能工厂(chǎng)的演(yǎn)示。

  目(mù)前(qián)富(fù)士康工业互联网、宜鼎国际、和硕、广达和纬(wěi)创正(zhèng)在使用这一(yī)参考工作流程,具体(tǐ)用例包括电(diàn)路板质(zhì)保检测(cè)点自动化(huà)、光学(xué)检测自动化、建设(shè)虚拟工厂(chǎng)、模(mó)拟协作机器人、构建及运营数(shù)字孪生等。

  MGX服务器规范:快(kuài)速(sù)高效构建百余种服务器配置

  英伟达发(fā)布NVIDIA MGX服务器规范,为系(xì)统(tǒng)制造商提(tí)供模块化参考架(jià)构,满足各种规模的数据中心需求。系(xì)统制(zhì)造商可使用(yòng)它(tā)快速且经济高效地(dì)构建100多种服(fú)务(wù)器配(pèi)置(zhì),以适应(yīng)广泛的AI、HPC及NVIDIA Omniverse应用。

  MGX支持英伟达全系列GPU、CPU、DPU和网络适(shì)配器、各种x86、完整软件(jiàn)堆栈及Arm处理器,还(hái)可(kě)集成到云和(hé)企业(yè)数据中心(xīn)中。

  华硕、和硕、QCT、超(chāo)微(wēi)(Supermicro)等都(dōu)将采用MGX构建(jiàn)下一代(dài)加速计算机,可将(jiāng)开(kāi)发(fā)成(chéng)本削减多(duō)达(dá)3/4,并将开发时间(jiān)缩(suō)短2/3至仅需(xū)6个月

  其中,QCT和超微基于MGX的设计(jì)将于(yú)8月面世。超微昨日公布的(de)ARS-221GL-NR系统将采(cǎi)用Grace CPU,而QCT的S74G-2U系统(tǒng)将采用Grace Hopper。

  推出(chū)Spectrum-X网(wǎng)络平(píng)台 构建(jiàn)超(chāo)大规模生成式AI超级计算(suàn)机(jī)Israel-1

  另(lìng)外,黄(huáng)仁勋宣(xuān)布推出(chū)NVIDIA Spectrum-X网(wǎng)络平台,旨在提高(gāo)基于(yú)以太网(wǎng)的AI云的(de)性能(néng)和(hé)效(xiào)率(lǜ)。

  相(xiāng)比传统以太网结构,Spectrum-X可实现(xiàn)1.7倍(bèi)的(de)整体AI性能和能效提升,并具有高度通用性,可用于各种AI应用。它使用完全基于(yú)标准的以太网,并可(kě)与基于(yú)以(yǐ)太网(wǎng)的堆(duī)栈互操(cāo)作。该平台支持256个200Gb/s端口,通过单(dān)个(gè)交(jiāo)换机连接(jiē),或在两层leaf-spine拓扑中提供(gōng)16000个端(duān)口,以支(zhī)持(chí)AI云(yún)增(zēng)长和扩展,在保持性能的(de)同时最(zuì)大(dà)限度减少网络延迟。

  全球领(lǐng)先云(yún)计算(suàn)提供商(shāng)正在采用(yòng)Spectrum-X平台扩展生成式(shì)AI服(fú)务,而Spectrum-X、Spectrum-4交(jiāo)换机(jī)、BlueField-3 DPU等已在戴尔、联(lián)想等系(xì)统(tǒng)制(zhì)造商处提(tí)供。

  此外,作为Spectrum-X参考设计的蓝图和测试平台,英伟达(dá)正构(gòu)建一台超(chāo)大规模生成式AI超级计算机Israel-1。这台(tái)AI超算价值(zhí)数亿美(měi)元,将采(cǎi)用戴尔(ěr)PowerEdge XE9680服务器(qì)、英伟(wěi)达HGX H100超级计(jì)算(suàn)平(píng)台、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平台(tái)。

  结(jié)语

  “40年来,我(wǒ)们(men)创造了PC、互联网、移(yí)动、云(yún),现在是(shì)人工智能时(shí)代(dài)。你会创造什(shén)么?不管是什么,都要(yào)像我(wǒ)们一样(yàng)追赶(gǎn)它。要奔跑,不(bù)要走。要么为(wèi)了食(shí)物(wù)奔跑,要么作为食物奔(bēn)跑。”

  在(zài)5月(yuè)27日的台湾大学发表了毕业(yè)典礼演讲上,黄(huáng)仁勋再次强(qiáng)调了掌(zhǎng)握(wò)AI技术(shù)的(de两害相权取其轻,两利相权取其重,两权相害取其轻正确说法是什么意思)重(zhòng)要性:很多人担心,AI会抢走自己的工作(zuò)。但真(zhēn)正会抢走你饭碗(wǎn)的,是掌握了AI技术的人。

  他表示(shì),从各方面来看(kàn),AI的(de)兴(xīng)盛是计算机产业(yè)的(de)再(zài)生契机。在下(xià)个十年,我们的(de)产业将使(shǐ)用(yòng)新型AI电脑,取(qǔ)代价值万亿美(měi)元(yuán)的传(chuán)统电脑。

  而(ér)从昨日大(dà)会上黄仁勋的展示中,人工(gōng)智能时代的未来轮廓似乎已逐渐浮现。

未经允许不得转载:橘子百科-橘子都知道 两害相权取其轻,两利相权取其重,两权相害取其轻正确说法是什么意思

评论

5+2=