H3C UniServer G6 a HPE Gen11 Series: Hlavní vydání AI serverů od H3C Group

S rychlým vzestupem aplikací umělé inteligence v čele s modely jako ChatGPT prudce vzrostla poptávka po výpočetním výkonu. Aby společnost H3C Group pod záštitou Tsinghua Unigroup splnila rostoucí výpočetní požadavky éry AI, nedávno na konferenci NAVIGATE Leader Summit 2023 představila 11 nových produktů v řadě H3C UniServer G6 a HPE Gen11. Tyto nové serverové produkty vytvářejí komplexní matici pro AI v různých scénářích, poskytují výkonnou základní platformu pro zpracování masivních dat a modelových algoritmů a zajišťují dostatek výpočetních zdrojů AI.

Různorodá matice produktů pro řešení různých počítačových potřeb AI

Jako lídr v oblasti inteligentních počítačů se H3C Group již mnoho let hluboce angažuje v oblasti umělé inteligence. V roce 2022 dosáhla společnost H3C nejvyššího tempa růstu na čínském trhu zrychlených počítačů a nashromáždila celkem 132 prvních míst na světě v mezinárodně uznávaném benchmarku AI MLPerf, což prokázalo své silné technické znalosti a schopnosti.

S využitím pokročilé výpočetní architektury a možností inteligentního řízení výpočetního výkonu postaveného na základech inteligentních počítačů vyvinula společnost H3C vlajkovou loď inteligentních počítačů H3C UniServer R5500 G6, speciálně navrženou pro školení modelů ve velkém měřítku. Představili také H3C UniServer R5300 G6, hybridní výpočetní engine vhodný pro rozsáhlé scénáře inference/tréninku. Tyto produkty dále splňují různé požadavky na výpočetní techniku ​​v různých scénářích umělé inteligence a poskytují komplexní počítačové pokrytí umělou inteligencí.

Vlajková loď Intelligent Computing Určená pro školení modelů ve velkém měřítku

H3C UniServer R5500 G6 kombinuje sílu, nízkou spotřebu energie a inteligenci. Ve srovnání s předchozí generací nabízí trojnásobný výpočetní výkon, což zkracuje dobu školení o 70 % pro scénáře školení velkých modelů GPT-4. Je použitelný pro různé podnikové scénáře AI, jako je rozsáhlá školení, rozpoznávání řeči, klasifikace obrázků a strojový překlad.

Síla: R5500 G6 podporuje až 96 jader CPU, což přináší 150% zvýšení výkonu jádra. Je vybaven novým 8-GPU modulem NVIDIA HGX H800, který poskytuje 32 PFLOPS výpočetního výkonu, což má za následek 9násobné zvýšení rychlosti trénování AI ve velkých modelech a 30násobné zlepšení výkonu odvození AI ve velkém měřítku. Navíc s podporou sítí PCIe 5.0 a 400G mohou uživatelé nasazovat výkonnější výpočetní clustery AI, což urychluje přijetí a aplikaci AI v podnicích.

Inteligence: R5500 G6 podporuje dvě konfigurace topologie, inteligentně se přizpůsobuje různým scénářům aplikací AI a zrychluje hluboké učení a vědecké výpočetní aplikace, což výrazně zlepšuje využití zdrojů GPU. Díky funkci více instancí GPU modulu H800 lze jeden H800 rozdělit na 7 instancí GPU s možností až 56 instancí GPU, z nichž každá má nezávislé výpočetní a paměťové zdroje. To výrazně zvyšuje flexibilitu zdrojů AI.

Nízká uhlíková stopa: R5500 G6 plně podporuje kapalinové chlazení, včetně kapalinového chlazení pro CPU i GPU. S PUE (Účinnost využití energie) nižší než 1,1 umožňuje „cool computing“ v žáru výpočetního rázu.

Stojí za zmínku, že R5500 G6 byl po svém vydání uznán jako jeden z „10 nejlepších vysoce výkonných serverů roku 2023“ v hodnocení „2023 Power Ranking for Computational Performance“.

Hybridní výpočetní engine pro flexibilní sladění požadavků na školení a odvození

H3C UniServer R5300 G6 jako server s umělou inteligencí nové generace nabízí ve srovnání se svým předchůdcem výrazná vylepšení ve specifikacích CPU a GPU. Může se pochlubit vynikajícím výkonem, inteligentní topologií a integrovanými výpočetními a úložnými schopnostmi, díky čemuž je vhodný pro trénování modelů hlubokého učení, inference hlubokého učení a další aplikační scénáře AI, přičemž flexibilně odpovídá potřebám školení a odvození výpočetní techniky.

Vynikající výkon: R5300 G6 je kompatibilní s nejnovější generací podnikových GPU NVIDIA a poskytuje 4,85x vyšší výkon ve srovnání s předchozí generací. Podporuje různé typy akceleračních karet AI, jako jsou GPU, DPU a NPU, aby vyhovovaly heterogenním požadavkům na výpočetní výkon AI v různých scénářích, což posiluje éru inteligence.

Inteligentní topologie: R5300 G6 nabízí pět nastavení topologie GPU, včetně HPC, paralelní AI, sériové AI, 4-kartový přímý přístup a 8-kartový přímý přístup. Tato bezprecedentní flexibilita výrazně zvyšuje přizpůsobivost různým scénářům uživatelských aplikací, inteligentně alokuje zdroje a zajišťuje efektivní provoz výpočetního výkonu.

Integrovaný výpočetní systém a úložiště: R5300 G6 flexibilně využívá akcelerační karty AI a inteligentní síťové karty, přičemž kombinuje možnosti školení a odvození. Podporuje až 10 GPU s dvojnásobnou šířkou a 24 slotů pro pevné disky LFF (Large Form Factor), což umožňuje simultánní školení a vyvozování na jediném serveru a poskytuje nákladově efektivní výpočetní engine pro vývojová a testovací prostředí. S úložnou kapacitou až 400 TB plně splňuje požadavky na úložný prostor dat AI.

S prudkým boomem umělé inteligence je výpočetní výkon neustále přetvářen a zpochybňován. Vydání serverů s umělou inteligencí nové generace je dalším milníkem v odhodlání skupiny H3C k technologii „inherentní inteligence“ a jejímu neustálému úsilí o vývoj inteligentních počítačů.

Při pohledu do budoucnosti, vedená strategií „Cloud-Native Intelligence“, se H3C Group drží konceptu „pečlivého pragmatismu, vybavujícího éru inteligencí“. Budou i nadále kultivovat úrodnou půdu inteligentních počítačů, zkoumat scénáře aplikací AI na hluboké úrovni a urychlit příchod inteligentního světa s adaptabilním výpočetním výkonem připraveným na budoucnost.


Čas odeslání: Červenec-04-2023