NVIDIA とパートナーが、ヴェラ ルービンの次世代高効率ギガワット AI ファクトリーの構築を推進

トレンドセッター
この記事を読むのにかかる時間: 5

OCP Global Summit において、NVIDIA はギガワット AI ファクトリーの未来を垣間見せます。

NVIDIA は、50 社を超える MGX パートナーが準備を進めている NVIDIA Vera Rubin NVL144 MGX 世代オープンアーキテクチャ ラックサーバーの仕様を公開します。また、576 基の Rubin Ultra GPU を接続する NVIDIA Kyber のエコシステムサポートも公開します。このサーバーは、増大する推論需要に対応するために構築されています。

20 社を超える業界パートナーが、NVIDIA Kyber ラックアーキテクチャをサポートする、ギガワット時代の次世代 800V 直流 (VDC) データセンター向けの新しいシリコン、コンポーネント、電源システム、サポートを展示します。

Foxconn は、800VDC 向けに建設中の 40 メガワットの台湾データセンター、高雄 1 の詳細を発表しました。 CoreWeave、Lambda、Nebius、Oracle Cloud Infrastructure、Together AIなどは、800Vデータセンター設計における業界のパイオニアです。さらに、Vertivは、省スペース、コスト効率、エネルギー効率に優れた800VDC MGXリファレンスアーキテクチャを発表しました。これは、包括的な電源・冷却インフラストラクチャアーキテクチャです。HPEは、NVIDIA Kyberに加え、Spectrum-X Ethernetプラットフォームの一部であるNVIDIA Spectrum-XGS Ethernetスケールアクロステクノロジーの製品サポートを発表しました。

従来の415VACまたは480VAC三相システムから800VDCインフラストラクチャに移行することで、データセンターの拡張性、エネルギー効率、材料使用量の削減、そしてパフォーマンス向上を実現できます。電気自動車業界や太陽光発電業界では、同様のメリットを得るために既に800VDCインフラストラクチャを採用しています。

Metaによって設立されたOpen Compute Projectは、数百のコンピューティングおよびネットワークプロバイダーからなる業界コンソーシアムであり、コンピューティングインフラストラクチャへの高まる需要を効率的にサポートするためのハードウェアテクノロジーの再設計に重点を置いています。

Vera Rubin NVL144:AIファクトリー向けに拡張可能な設計

Vera Rubin NVL144 MGXコンピュートトレイは、エネルギー効率に優れた100%液冷式のモジュラー設計を採用しています。中央のプリント基板ミッドプレーンは、従来のケーブル接続に代わるもので、組み立てと保守を迅速化します。また、NVIDIA ConnectX-9 800GB/sネットワークと、大規模コンテキスト推論を実現するNVIDIA Rubin CPX用のモジュラー拡張ベイを備えています。

NVIDIA Vera Rubin NVL144は、アクセラレーテッドコンピューティングアーキテクチャとAIパフォーマンスの飛躍的な向上を実現します。高度な推論エンジンとAIエージェントの要求に応えるよう設計されています。

基本設計はMGXラックアーキテクチャに基づいており、50社を超えるMGXシステムおよびコンポーネントパートナーによってサポートされます。NVIDIAは、アップグレードされたラックとコンピュートトレイのイノベーションを、OCPコンソーシアムのオープンスタンダードとして提供する予定です。

コンピューティングトレイとラックの標準規格により、パートナーはモジュール方式で製品を組み合わせて使用​​し、アーキテクチャに合わせてより迅速に拡張できます。Vera Rubin NVL144 ラック設計は、エネルギー効率の高い 45°C 液冷、高性能を実現する新しい液冷バスバー、そして電力を安定的に維持するための 20 倍のエネルギー貯蔵を特徴としています。

MGX によるコンピューティングトレイとラックアーキテクチャのアップグレードは、AI ファクトリーのパフォーマンスを向上させるとともに、組み立てを簡素化し、ギガワット規模の AI インフラストラクチャへの迅速な導入を可能にします。

NVIDIA は、NVIDIA GB200 NVL72 システムの電気機械設計の主要部分を含む、複数世代のハードウェアにわたる OCP 標準規格の主要貢献者です。同じ MGX ラックフットプリントで GB300 NVL72 をサポートし、Vera Rubin NVL144、Vera Rubin NVL144 CPX、Vera Rubin CPX もサポートすることで、より高いパフォーマンスと迅速な導入を実現します。

作れば、人は集まる:NVIDIA Kyberラックサーバー世代

OCPエコシステムは、800VDC電力供給、液冷、機械設計におけるイノベーションを特徴とするNVIDIA Kyberへの準備も進めています。

これらのイノベーションは、NVIDIA Oberonの後継となるラックサーバー世代NVIDIA Kyberへの移行を支えるものであり、2027年までに576基のNVIDIA Rubin Ultra GPUを搭載した高密度プラットフォームを搭載する予定です。

高電力供給の課題に対処する最も効果的な方法は、電圧を上げることです。従来の415Vまたは480VAC三相システムから800VDCアーキテクチャへの移行には、さまざまなメリットがあります。

この移行により、ラックサーバーパートナーは、ラック内コンポーネントを54VDCから800VDCに移行し、より良い結果を得ることができます。MGXラックサーバーリファレンスアーキテクチャのオープンスタンダードに賛同する、直流インフラプロバイダー、電源システムおよび冷却パートナー、そしてシリコンメーカーからなるエコシステムが、このイベントに参加しました。

NVIDIA Kyber は、ラック GPU の密度を高め、ネットワーク サイズをスケールアップし、大規模 AI インフラストラクチャのパフォーマンスを最大化するために設計されています。棚の本のようにコンピューティング ブレードを垂直に回転させることにより、Kyber はシャーシあたり最大 18 台のコンピューティング ブレードを搭載できます。また、専用の NVIDIA NVLink スイッチ ブレードがケーブル不要のミッドプレーンを介して背面に統合されており、シームレスなスケールアップ ネットワークを実現します。

800 VDC では、同じ銅線で 150% 以上多くの電力を伝送できるため、1 つのラックに電力を供給するために 200 kg の銅バスバーを使用する必要がなくなります。

Kyber は、今後数年間で最先端の生成 AI ワークロードに優れたパフォーマンス、効率、信頼性をもたらし、ハイパースケール AI データセンターの基盤となるでしょう。NVIDIA Kyber ラックは、お客様が使用する銅線の量を大幅に削減する方法を提供し、数百万ドルのコスト削減につながります。

NVIDIA NVLink Fusion エコシステムが拡大

ハードウェアに加え、NVIDIA NVLink Fusion も勢いを増しています。これにより、企業はセミカスタムシリコンを高度に最適化された広く導入されているデータセンターアーキテクチャにシームレスに統合し、複雑さを軽減して市場投入までの時間を短縮できます。

Intel と Samsung Foundry は、カスタムシリコン設計者、CPU および IP パートナーを含む NVLink Fusion エコシステムに参画します。これにより、AI ファクトリーは迅速にスケールアップし、モデルのトレーニングやエージェント AI 推論といった要求の厳しいワークロードに対応できるようになります。

最近発表された NVIDIA と Intel の協業の一環として、Intel は NVLink Fusion を使用して NVIDIA インフラストラクチャ プラットフォームに統合される x86 CPU を開発します。
Samsung Foundry は、カスタム CPU とカスタム XPU の需要の高まりに対応するため、NVIDIA と提携し、カスタムシリコンの設計から製造まで一貫したエクスペリエンスを提供しています。
オープンなエコシステムが必要:次世代 AI ファクトリーの拡張

20 社を超える NVIDIA パートナーが、オープンスタンダードに準拠したラックサーバーの提供を支援し、将来のギガワット規模の AI ファクトリーを実現します。

シリコンプロバイダー:Analog Devices, Inc. (ADI)、AOS、EPC、Infineon、Innoscience、MPS、Navitas、onsemi、Power Integrations、Renesas、Richtek、ROHM、STMicroelectronics、Texas Instruments
電源システムコンポーネントプロバイダー:BizLink、Delta、Flex、GE Vernova、Lead Wealth、LITEON、Megmeet
データセンター電源システムプロバイダー:ABB、Eaton、GE Vernova、Heron Power、Hitachi Energy、Mitsubishi Electric、Schneider Electric、Siemens、Vertiv

NVIDIAとOpen Compute Projectの詳細については、10月13日から16日までサンノゼ・コンベンションセンターで開催されるOCP Global Summitをご覧ください。

カテゴリー:データセンター
タグ:GB200 | GB300 | NVL72 | NVLink

出典: 元記事を読む

※現在お読みいただいているこの記事は、国内外のニュースソース等から取得した情報を自動翻訳した上で掲載しています。
内容には翻訳による解釈の違いが生じる場合があり、また取得時の状況により本文以外の情報や改行、表などが正しく反映されない場合がございます。
順次改善に努めてまいりますので、参考情報としてご活用いただき、必要に応じて原文の確認をおすすめいたします。

TOP
CLOSE
 
SEARCH