GPU アクセラレーション AI ストレージで AI 対応エンタープライズデータを提供

トレンドセッター
この記事を読むのにかかる時間: 4

AIエージェントは、複雑なタスクの自動化に不可欠なツールとなる可能性を秘めています。しかし、エージェントを本番環境に導入するのは依然として困難です。

ガートナー社によると、「AIプロトタイプの約40%が本番環境に移行しており、調査参加者はデータの可用性と品質がAI導入における最大の障壁であると回答しています。」1

人間の労働者と同様に、AIエージェントがビジネス価値を提供するには、安全で関連性が高く、正確で最新のデータが必要です。業界では現在、これを「AI対応データ」と呼んでいます。

企業のデータをAI対応にするには、特有の課題があります。ガートナー社は、「文書やマルチメディアファイルなどの非構造化データは、組織データの70%から90%を占めており、その量、多様性、そして一貫性のない構造のために、特有のガバナンス上の課題が生じています。」と推定しています。2 非構造化データソースには、電子メール、PDF、動画、音声クリップ、プレゼンテーションなどがあります。

GPUアクセラレーションを活用したデータおよびストレージインフラストラクチャの新たなクラスであるAIデータプラットフォームは、非構造化データを迅速かつ安全にAI対応データに変換します。

AI対応データとは?

AI対応データは、追加の準備なしに、AIトレーニング、微調整、そして検索強化型生成パイプラインで利用できます。

非構造化データをAI対応にするには、以下の手順が必要です。

多様なソースからデータを収集し、キュレーションする。
データ管理とガバナンスのためのメタデータを適用する。
ソースドキュメントを意味的に関連性のあるチャンクに分割する。
チャンクをベクトルに埋め込み、効率的な保存、検索、そして取得を可能にする。

企業は、非構造化データがAI対応になるまで、AI投資の価値を最大限に引き出すことはできません。

データをAI対応にすることが難しい理由

非構造化データをAI対応にすることは、多くの企業にとって依然として大きな課題です。その理由は次のとおりです。

データの複雑さ:一般的な企業は、動画、音声、テキスト、画像など、数十もの形式とモダリティを持つ数百もの多様なデータソースを保有しています。これらのデータは、異なるストレージサイロに分散して保存されています。
データの速度:ビジネスデータの量は爆発的に増加しています。予測によると、今後4年間で世界中の保存データは倍増します。また、企業がカメラフィードなどのリアルタイムストリーミングセンサーを導入するにつれて、データの変化率は増加しています。
データの無秩序な拡散とデータドリフト:頻繁なデータのコピーと変換は、コストとセキュリティリスクをもたらします。時間の経過とともに、テキストチャンクや埋め込みなどのAI表現の内容や権限は、信頼できる情報源となるドキュメントから乖離していきます。さらに、チャットボットやエージェントの数が増えるにつれて、データのセキュリティリスクは増大します。

これらの要因により、企業のデータサイエンティストは、データの検索、クリーニング、整理に多くの時間を費やすことになり、貴重な洞察の特定に費やす時間が少なくなってしまいます。

AIデータプラットフォーム – 新しいクラスのエンタープライズデータおよびストレージインフラストラクチャ

AIデータプラットフォームは、GPUアクセラレーションを活用した新しいクラスのデータおよびストレージインフラストラクチャであり、エンタープライズデータをAI対応にします。

GPUアクセラレーションをデータパスに直接組み込むことで、AIデータプラットフォームは、ユーザーには見えないバックグラウンド処理としてAIパイプライン用のデータを変換します。

データはその場で準備されるため、不要なコピーやそれに伴うセキュリティリスクは最小限に抑えられます。

データ準備をストレージインフラストラクチャの中核機能として統合することで、AIデータプラットフォームはデータの正確性とセキュリティを確実に維持します。編集や権限変更など、信頼できる情報源となるドキュメントへの変更は、関連するベクトル埋め込みに即座に反映されます。

AIデータプラットフォームの主なメリットは次のとおりです。

価値実現までの時間の短縮:企業はAIデータパイプラインをゼロから設計、構築、最適化する必要はありません。AIデータプラットフォームは、すぐに使用できる統合型で最先端のAIデータパイプラインを提供します。

データドリフトの低減:AIデータプラットフォームは、企業データをほぼリアルタイムで継続的に取り込み、埋め込み、インデックス付けすることで、洞察を得るまでの時間を短縮し、データドリフトを最小限に抑えます。

データセキュリティの向上:信頼できる情報源となるドキュメントはAIデータプラットフォームにまとめて保存されるため、その内容や権限に変更があれば、それらを使用するAIアプリケーションに即座に反映されます。
データガバナンスの簡素化:データを適切な場所に準備することで、アクセス制御、トレーサビリティ、コンプライアンスを損なうシャドウコピーの増殖を削減します。
GPU 利用率の向上:AI データ プラットフォームでは、管理対象データの量、種類、変更速度に合わせて GPU 容量が決定されます。GPU 容量はデータ量に応じて拡張されるため、データ準備タスクに対して GPU が過剰または不足することはありません。
NVIDIA AI データ プラットフォーム

AI はあらゆる業界に変革をもたらしています。AI データ プラットフォームは、生成型 AI 時代におけるエンタープライズ ストレージの自然な進化であり、受動的なコンテナからビジネス価値を提供するアクティブなエンジンへと変化しています。

GPU アクセラレーションをデータパスに統合することで、AI データ プラットフォームは、企業が AI 対応データを使用して AI エージェントを迅速かつ安全に起動することを可能にします。

NVIDIA AI データ プラットフォーム リファレンス デザインは、NVIDIA RTX PRO 6000 Blackwell Server Edition GPU、NVIDIA BlueField-3 DPU、そして NVIDIA Blueprints に基づく統合 AI データ処理パイプラインを統合しています。

NVIDIA AI Data Platform の設計は、Cisco、Cloudian、DDN、Dell Technologies、Hitachi Vantara、HPE、IBM、NetApp、Pure Storage、VAST Data、WEKA といった主要な AI インフラストラクチャおよびストレージ プロバイダーに採用されており、各社が独自の差別化とイノベーションによって設計を拡張しています。

NVIDIA AI Data Platform の詳細については、こちらをご覧ください。また、AI データ プラットフォームに関する NVIDIA AI Podcast エピソードもお聴きください。

1 Gartner、「効果的なデータ品質運用モデルの設計方法」(Sue Waite および Melody Chien 著)、2025 年 7 月 15 日

2 Gartner、「AI 対応に向けた非構造化データの管理:戦略ロードマップ」(Melody Chien 著)、2025 年 8 月 14 日

GARTNER は、米国および国際的に Gartner, Inc. および/またはその関連会社の登録商標およびサービスマークであり、本書では許可を得て使用しています。All rights reserved.

カテゴリ: データセンター | ハードウェア | ネットワーキング
タグ: エージェント型 AI

出典: 元記事を読む

※現在お読みいただいているこの記事は、国内外のニュースソース等から取得した情報を自動翻訳した上で掲載しています。
内容には翻訳による解釈の違いが生じる場合があり、また取得時の状況により本文以外の情報や改行、表などが正しく反映されない場合がございます。
順次改善に努めてまいりますので、参考情報としてご活用いただき、必要に応じて原文の確認をおすすめいたします。

TOP
CLOSE
 
SEARCH