绿茶通用站群绿茶通用站群

灰姑娘作者是安徒生还是格林

灰姑娘作者是安徒生还是格林 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热(rè)潮”最大赢家(jiā)之一、英伟达背后的那(nà)个(gè)身穿黑色(sè)皮衣的男人灰姑娘作者是安徒生还是格林(rén)又来了(le)。

  前脚才(cái)交出(chū)亮眼业(yè)绩狂拉股价,英伟达CEO黄仁勋后脚就在昨日的(de)COMPUTEX大会上宣(xuān)布,“我们(men)已(yǐ)到达生成式AI引爆点。从(cóng)此,全世界(jiè)的(de)每个角落,都(dōu)会有计算(suàn)需求。”

  如今英伟达掌握着全球多家(jiā)科技(jì)公(gōng)司“算力命(mìng)脉”,而在这(zhè)场大会上,黄仁勋(xūn)激情(qíng)演(yǎn)讲2个小时,甩出了多项重(zhòng)磅(bàng)新发布,包括算力(lì)“杀器”DGX GH200超级计算机、针对游戏(xì)的ACE代工服务、MGX服务器规范等(děng)内容。

  算(suàn)力“杀器”:DGX GH200超级计算机+GH200超级芯(xīn)片

  先看“集成了英伟达最(zuì)先(xiān)进(jìn)加速计算(suàn)和网络(luò)技(jì)术”的DGX GH200人(rén)工智能超(chāo)级计算机

  这款超算专(zhuān)为大(dà)规(guī)模(mó)生成式AI的负载所(suǒ)设计,由256块GH200超级芯片(piàn)组成,拥有1 exaflop超凡AI性(xìng)能、144TB内存(是英(yīng)伟达目(mù)前DGX A100系统的近500倍)、150英里光(guāng)纤、2000多个风(fēng)扇。

  DGX GH200重达40000磅(约合18143千克),堪比四(sì)只成年大象的体重。

  预计DGX GH200将(jiāng)于(yú)今年年底投入问世,英伟(wěi)达暂未公(gōng)布(bù)价格,而谷歌(gē)云、Meta与微软将是首(shǒu)批用户(hù)

  同(tóng)时,英(yīng)伟达也(yě)正在打造自家基于DGX GH200的大型AI超级计算机NVIDIA Helios,以(yǐ)支持其研究和开发团队的工作。其(qí)中采用4个DGX GH200系统、1024颗Grace Hopper超(chāo)级芯片,每(měi)个都(dōu灰姑娘作者是安徒生还是格林)将与英伟达(dá)Quantum-2 InfiniBand网(wǎng)络连接,带宽高达400Gb/s,将于今年年底上(shàng)线。

  值得一提的是,黄仁(rén)勋透露(lù),DGX GH200集成的GH200 Grace Hopper超级芯片已进(jìn)入全面生产

  “拉(lā)踩”CPU:成本、功耗、处理数据量不如GPU

  在本次(cì)大会上,黄仁勋还“拉(lā)踩”了一波CPU。他从(cóng)功耗、处理数据量等方面,指出使用GPU胜过CPU。

  举例来说,花费(fèi)1000万美(měi)元,可以(yǐ)建设一(yī)个(gè)有960颗CPU的数据中心,其可(kě)处(chù)理1X LMM(大(dà)语言模型(xíng))数据量(liàng),需要(yào)11GWh功耗;

  同样成本下,也可以建设一个(gè)有48个GPU的数据中心,其可处(chù)理44X LLM数据(jù)量(liàng),仅需(xū)要3.2GWh功耗。

  若只想处理1X LMM数据量,则只需40万美(měi)元,便(biàn)可拥(yōng)有一(yī)个(gè)搭载2个(gè)GPU、功耗仅0.13GWh的数据(jù)中心(xīn)。

  “买越多,省越多(The more you buy, the more you save)。”黄(huáng)仁勋再次(cì)表示(shì)。

  同时,他也列出了(le)数据中心成本公式:数据中心(xīn)总持有成(chéng)本=f[成本(芯片、系统、硬(yìng)件生态系统)、吞(tūn)吐量(GPU、Algo软件、网络、系统软件、软件生态系统)、使用率(Algo Lib, 软件(jiàn)生态系统)、采购运营、生(shēng)命周(zhōu)期(qī)最佳(jiā)化、电力]

  ACE代工服(fú)务(wù):用AI激活(huó)NPC生命

  游戏一直是(shì)备(bèi)受关注(zhù)的一大(dà)AI应(yīng)用落(luò)地领域。英伟达也在大(dà)会上宣(xuān)布(bù),推出面向游戏的定(dìng)制(zhì)AI模型代(dài)工服(fú)务(wù)NVIDIA Avatar Cloud Engine(ACE)

  它能赋予(yǔ)非玩家角色(NPC)更智能且不断进化的(de)对(duì)话技能,中(zhōng)间件、工具和游(yóu)戏开发者(zhě)可使用它(tā)来(lái)构(gòu)建和(hé)部(bù)署定(dìng)制的(de)语音(yīn)、对话和动画AI模型

  其中(zhōng)包括:英伟达(dá)NeMo,使用专(zhuān)有数据构建、定制和部(bù)署语言模型;英(yīng)伟达Riva,用于自动语音识别和文本转语音实现(xiàn)实时(shí)语音对话;英(yīng)伟(wěi)达Omniverse Audio2Face,用于即时创(chuàng)建(jiàn)游戏角色(sè)表情(qíng)动(dòng)画,以匹配(pèi)任何(hé)语音轨(guǐ)道。

  开(kāi)发人(rén)员(yuán)可选择集成整个NVIDIA ACE for Games解(jiě)决方案,也可仅使用需(xū)要的组(zǔ)件。

  新参(cān)考工(gōng)作流程(chéng):帮助建设数字化智能工厂

  黄仁勋表示,全球电子制造(zào)商正在使用(yòng)一种全新的综合参考工作流程推进工(gōng)业数(shù)字化(huà)工作,该工作流程结合了英伟达用于生成式(shì)AI、3D协作、仿真和(hé)自主(zhǔ)机器(qì)的技术,包括(kuò):

  英伟达Omniverse,其连接了(le)顶级计算机辅(fǔ)助设(shè)计应用以及生成(chéng)式AI的API和(hé)前沿(yán)框架;用于(yú)模拟和测试机器(qì)人(rén)的英伟达(dá)Isaac Sim应用程(chéng)序;英伟达Metropolis视觉AI框架,用于自动光学检测。

  同时,黄(huáng)仁勋现场展(zhǎn)示了(le)一个完全(quán)数(shù)字化的(de)智能工厂(chǎng)的(de)演示。

  目前富士康工(gōng)业(yè)互联(lián)网(wǎng)、宜鼎(dǐng)国际、和硕、广达和纬创正在使用这(zhè)一(yī)参考工作流程,具体用例包括电路板质保(bǎo)检测点自动化(huà)、光学检测自动化(huà)、建设虚(xū)拟工(gōng)厂(chǎng)、模(mó)拟(nǐ)协作机器(qì)人、构建及运(yùn)营数字孪生等。

  MGX服务器规范:快速高(gāo)效构(gòu)建百余种(zhǒng)服务器配置

  英伟(wěi)达发布NVIDIA MGX服务器规范,为系统(tǒng)制造商提供模块化参考架构,满足(zú)各(gè)种规(guī)模(mó)的数据中(zhōng)心需(xū)求。系统制造商(shāng)可使用它快速(sù)且经(jīng)济高效地构建100多种服务器配置,以适应(yīng)广泛(fàn)的AI、HPC及NVIDIA Omniverse应用。

  MGX支持英(yīng)伟达(dá)全系列(liè)GPU、CPU、DPU和网(wǎng)络(luò)适(shì)配器、各种(zhǒng)x86、完整软件堆栈及Arm处理器,还(hái)可集成到云和企业数据中心中。

  华(huá)硕、和硕、QCT、超微(Supermicro)等(děng)都(dōu)将采用MGX构建(jiàn)下一代(dài)加速计算(suàn)机,可将开发成(chéng)本(běn)削减多(duō)达3/4,并将开发时间缩短2/3至仅需6个月

  其中,QCT和超微基于MGX的设计将于8月面(miàn)世。超微昨日公(gōng)布(bù)的(de)ARS-221GL-NR系统将采用(yòng)Grace CPU,而QCT的(de)S74G-2U系(xì)统将采用Grace Hopper。

  推出Spectrum-X网络平台 构建超(chāo)大规模生成式AI超级计算机(jī)Israel-1

  另(lìng)外,黄仁勋宣布推出NVIDIA Spectrum-X网络(luò)平台(tái),旨在提高基(jī)于以太网的AI云的性能和效率。

  相比(bǐ)传统以太网(wǎng)结构,Spectrum-X可实现1.7倍的整(zhěng)体AI性能(néng)和能(néng)效(xiào)提升,并具(jù)有高(gāo)度(dù)通用性,可用于各种(zhǒng)AI应(yīng)用(yòng)。它使用完(wán)全基(jī)于(yú)标准的以太网,并可与基(jī)于(yú)以太网的堆栈(zhàn)互操作。该(gāi)平台支持256个200Gb/s端口,通过单(dān)个交(jiāo)换机连接,或在(zài)两层leaf-spine拓扑(pū)中提供16000个端口,以支持(chí)AI云增长和扩展,在保持性(xìng)能(néng)的(de)同时最大限度(dù)减少(shǎo)网络延迟。

  全球领(lǐng)先(xiān)云计算提供商正(zhèng)在采(cǎi)用Spectrum-X平(píng)台扩展生成式AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已(yǐ)在戴尔、联想等系统(tǒng)制造商处提供。

  此(cǐ)外(wài),作为Spectrum-X参考设计的蓝图和测试平台,英伟(wěi)达(dá)正构建一(yī)台超大规(guī)模生成式AI超级计算(suàn)机Israel-1。这台AI超算价(jià)值(zhí)数亿美元,将采用戴尔(ěr)PowerEdge XE9680服务器、英伟达HGX H100超级计算(suàn)平(píng)台(tái)、内置BlueField-3 DPU和(hé)Spectrum-4交换机的(de)Spectrum-X平台。

  结(jié)语(yǔ)

  “40年来,我们创造(zào)了PC、互(hù)联网、移动、云,现在是人工(gōng)智能(néng)时代。你会创造什么?不管是什么,都要像我们一(yī)样追赶它。要奔跑,不要走。要么(me)为了(le)食物奔跑,要么作为食(shí)物(wù)奔(bēn)跑。”

  在5月27日的台湾大学发表了(le)毕业典(diǎn)礼演讲上,黄仁勋再次强调了掌握AI技术(shù)的重要性:很(hěn)多人(rén)担心,AI会抢走(zǒu)自己(jǐ)的工作(zuò)。但真(zhēn)正会抢走(zǒu)你饭(fàn)碗的,是掌握(wò)了(le)AI技(jì)术的人。

  他表(biǎo)示,从各方(fāng)面来看,AI的兴盛是(shì)计算机产业的再生契机。在下个十年(nián),我们的产业将(jiāng)使用(yòng)新型(xíng)AI电脑,取代价(jià)值万亿(yì)美元(yuán灰姑娘作者是安徒生还是格林)的传统电脑。

  而从昨日大会上黄(huáng)仁(rén)勋(xūn)的展示(shì)中,人工(gōng)智能时代的未(wèi)来轮(lún)廓似乎已逐渐浮现。

未经允许不得转载:绿茶通用站群 灰姑娘作者是安徒生还是格林

评论

5+2=