CrowdStrike、Uber、Zoom は、NVIDIA Nemotron と Cosmos 推論モデルを使用して、エンタープライズおよび物理 AI アプリケーション向けのよりスマートなエージェントを構築する業界のパイオニアです。

トレンドセッター
この記事を読むのにかかる時間: 7

Capgeminiによると、AIエージェントは2028年までに収益増加とコスト削減により最大4,500億ドルの収益をもたらすと見込まれています。これらのエージェントを開発する開発者は、AIエージェント・プラットフォームと物理AIシステムの改善を目指し、より高性能な推論モデルを採用しています。

NVIDIAは本日、SIGGRAPHにおいて、推論機能を備えた2つのモデルファミリー(NVIDIA NemotronとNVIDIA Cosmos)の拡充を発表しました。これらのモデルファミリーは、AIエージェントとヒューマノイドロボットのチームによる生産性向上に、様々な業界のリーダー企業によって活用されています。

CrowdStrike、Uber、Magna、NetApp、Zoomなど、多くの企業がこれらのモデルファミリーを活用しています。

新しいNVIDIA Nemotron Nano 2とLlama Nemotron Super 1.5モデルは、科学的推論、数学、コーディング、ツール呼び出し、指示追従、チャットにおいて、それぞれのサイズカテゴリーで最高の精度を提供します。これらの新しいモデルにより、AIエージェントはより深く考え、より効率的に作業できるようになります。より幅広い選択肢を探索し、研究を加速させ、設定された時間制限内でよりスマートな結果を提供できるようになります。

このモデルはAIエージェントの脳のようなもので、中核となるインテリジェンスを提供します。しかし、その脳をビジネスで活用するには、業界用語やビジネス用語に加えて、特定のワークフローを理解し、安全に動作するエージェントに組み込む必要があります。NVIDIAは、AIエージェントの大規模なオンボーディング、カスタマイズ、ガバナンスのための主要なライブラリとAIブループリントを提供することで、企業がこのギャップを埋められるよう支援します。

Cosmos Reasonは、物理AIアプリケーション向けの新しい推論視覚言語モデル(VLM)であり、構造化推論を用いて物理、物体の永続性、時空間の整合などの概念を理解し、現実世界の仕組みを理解することに優れています。

Cosmos Reason は、ロボット視覚言語動作 (VLA) モデルの推論バックボーンとして、またはロボット工学や自律走行車のトレーニングデータの批評とキャプション作成のために特別に構築されており、工場や都市などの物理的な動作における時空間理解と推論をランタイム視覚 AI エージェントに提供します。

Nemotron: エージェント型エンタープライズ AI のための最高の精度と効率

企業が複雑で多段階的なタスクに対処するために AI エージェントを開発する中で、高い推論精度と効率的なトークン生成を提供するモデルは、大規模なインテリジェントで自律的な意思決定を可能にします。

NVIDIA Nemotron は、最先端のモデル、NVIDIA がキュレーションしたオープンデータセット、そして高度な AI 技術を活用し、AI エージェントに正確かつ効率的な開始点を提供する、高度なオープン推論モデルのファミリーです。

最新の Nemotron モデルは、新しいハイブリッドモデルアーキテクチャ、コンパクトな量子化モデル、そして開発者がトークン生成を制御できる構成可能な思考予算という 3 つの方法で、卓越した効率性を実現します。これにより、推論コストが 60% 削減されます。この組み合わせにより、モデルはより多くの時間や計算能力を必要とせずに、より深い推論とより高速な応答が可能になります。つまり、より低コストでより良い結果を得ることができます。

Nemotron Nano 2は、同サイズの主要モデルと比較して、最大6倍のトークン生成能力を提供します。

Llama Nemotron Super 1.5は、クラス最高のパフォーマンスと最高の推論精度を実現し、AIエージェントがより優れた推論を行い、よりスマートな意思決定を行い、複雑なタスクを自律的に処理することを可能にします。NVFP4(4ビット浮動小数点)で利用可能になり、NVIDIA B200 GPUではNVIDIA H100 GPUと比較して最大6倍のスループットを実現します。

上のグラフは、Nemotronモデルが同じ時間枠と同じ計算予算で最高の推論精度を実現し、最高のコスト効率を実現していることを示しています。

NVIDIA は、2 つの新しい Nemotron モデルに加え、初のオープン VLM トレーニング データセットである Llama Nemotron VLM データセット v1 も発表しました。このデータセットには、光学式文字認識 (OCR)、ビジュアル QA (ビジュアル品質保証)、キャプション作成データの 300 万サンプルが含まれており、既にリリースされている Llama 3.1 Nemotron Nano VL 8B モデルを駆動しています。

エージェントは、推論モデルの精度に加え、検索拡張型生成 (ARG) も活用することで、さまざまなソースにまたがる接続データから最新かつ最も関連性の高い情報を取得し、情報に基づいた意思決定を行います。最近リリースされた Llama 3.2 NeMo Retriever 埋め込みモデルは、ViDoRe V1、ViDoRe V2、MTEB VisualDocumentRetrieval の 3 つのビジュアル ドキュメント検索リーダーボードでトップにランクされ、エージェント システムの精度向上に貢献しています。

これらの推論および情報検索モデルを活用し、AI-Q NVIDIA ブループリントを使用して構築されたディープ リサーチ エージェントは、現在、DeepResearch Bench におけるオープンかつポータブルなエージェントとして第 1 位を獲得しています。

NVIDIA NeMo と NVIDIA NIM マイクロサービスは、エージェントシステムの開発と展開から監視と最適化に至るまで、AI エージェントのライフサイクル全体をサポートします。

Cosmos Reason:物理 AI におけるブレークスルー

VLM はコンピュータービジョンとロボティクスに画期的な進歩をもたらし、機械が物体やパターンを識別できるようにしました。しかし、非推論型 VLM は現実世界を理解し、相互作用する能力を欠いています。つまり、曖昧さや新しい体験に対処したり、複雑な複数ステップのタスクを解決したりすることができません。

NVIDIA Cosmos Reason は、物理 AI とロボティクス向けの、オープンでカスタマイズ可能な、70 億パラメータの推論型 VLM です。Cosmos Reason により、ロボットやビジョン AI エージェントは、事前知識、物理理解、そして常識を用いて、人間のように推論し、物理世界を理解し、行動することができます。

Cosmos Reason は、トレーニングデータの批評とキャプション作成、ロボットによる意思決定、ビデオ分析 AI エージェントなど、ロボティクスと物理 AI アプリケーション全体にわたる高度な機能を実現します。

大規模で多様なトレーニングデータセットのキュレーションとアノテーションを自動化し、高精度AIモデルの開発を加速します。また、ロボットプランニングのための高度な推論エンジンとしても機能し、複雑な指示を新しい環境でもVLAモデルが実行可能なステップへと解析します。

また、NVIDIA Blueprint for video search and summarization (VSS) 上に構築されたビデオ分析AIエージェントにもCosmos Reasonが採用されており、NVIDIA Metropolisプラットフォームによって実現され、膨大な量の保存済みまたはライブビデオデータから貴重な洞察を引き出します。これらの視覚認識と対話性に優れたAIエージェントは、異常を検知することで、工場、倉庫、小売店、空港、交差点などでの業務効率化に貢献します。

NVIDIAのロボティクス研究チームは、データのフィルタリングとキュレーション、そしてNVIDIA Isaac GR00T NXの次期バージョンなどのVLAモデルの基盤となる「System 2」推論VLMとしてCosmos Reasonを使用しています。

提供開始:あらゆる場所でAIエージェントとロボットにNVIDIA推論モデルを提供

多様な企業やコンサルティング業界のリーダー企業が、NVIDIAの最新推論モデルを採用しています。サイバーセキュリティから通信業界まで、幅広い分野のリーダー企業がNemotronと提携してエンタープライズAIエージェントを構築しています。

Zoomは、Zoom AI CompanionとNemotron推論モデルを活用し、Zoomミーティング、Zoomチャット、Zoomドキュメント全体でユーザーのために意思決定を行い、複数段階のタスクを管理する予定です。

CrowdStrikeは、Charlotte AIエージェントがCrowdStrike Falconプラットフォーム上でクエリを作成できるように、Nemotronモデルをテストしています。

Amdocsは、amAIz SuiteでNVIDIA Nemotronモデルを使用して、ケア、営業、ネットワーク、顧客サポートにわたる複雑で複数段階の自動化をAIエージェントが処理できるようにしています。

EYは、高いスループットを理由に、大規模組織の税務、リスク管理、財務のユースケースにおけるエージェント型AIをサポートするために、Nemotron Nano 2を採用しています。

NetAppは現在、AIエージェントがビジネスデータを検索・分析できるように、Nemotron推論モデルをテストしています。

DataRobotは、エンドツーエンドのエージェントライフサイクル管理を実現するAgent Workforce PlatformにNemotronモデルを採用しています。

Tabnineは、開発者に代わってコーディングタスクを提案・自動化するためにNemotronモデルを採用しています。

Automation Anywhere、CrewAI、Dataikuなど、エージェントAIソフトウェア開発企業もNemotronモデルを自社プラットフォームに統合しています。

交通、安全、AIインテリジェンスの分野の大手企業は、自動運転、ビデオ分析、道路および職場の安全向上のためにCosmos Reasonを活用しています。

Uberは、自動運転車の挙動分析にCosmos Reasonを活用しています。さらに、UberはCosmos Reasonを事後学習させ、視覚データを要約し、歩行者が高速道路を横断するなどのシナリオを分析して質の高い分析を行い、自動運転車の挙動に役立てています。

Cosmos Reasonは、自動運転車の頭脳としても機能します。これにより、ロボットは環境を解釈し、複雑なコマンドを与えられた場合でも、未知の環境でも常識的にタスクを分解して実行できるようになります。

Centificは、AIを活用したビデオインテリジェンスプラットフォームを強化するため、Cosmos Reasonをテストしています。VLMにより、プラットフォームは複雑なビデオデータを実用的な洞察へと処理し、誤検知を削減し、意思決定の効率性を向上させます。

VASTは、NVIDIA Cosmos Reasonと自社のAIオペレーティングシステムを活用し、大規模なビデオストリーム処理においてリアルタイムの都市インテリジェンスを推進しています。VSSブループリントを使用することで、VASTはインシデントを特定して対応をトリガーするエージェントを構築し、ビデオストリームとメタデータを実用的なプロアクティブな公共安全ツールに変換できます。

Ambient.aiは、Cosmos Reasonの時系列物理法則に基づく推論技術を活用し、不足している個人用保護具の自動検出と危険な状況の監視を実現し、建設、製造、物流、その他の産業現場における環境の健康と安全の向上に貢献しています。

Magnaは、City Delivery Platform(完全自律型で低コストの即時配送ソリューション)の一部としてCosmos Reasonを活用し、車両が新しい都市に迅速に適応できるよう開発を進めています。このモデルは、車両の長期的な軌道計画に世界理解を追加します。

これらのモデルは、NVIDIA NIMマイクロサービスとして提供される予定で、NVIDIAアクセラレーションインフラストラクチャ上で安全かつ信頼性の高いデプロイメントを実現し、プライバシーと制御を最大限に高めます。近日中に、Amazon BedrockおよびAmazon SageMaker AI for Nemotronモデル、Azure AI Foundry、Oracle Data Science Platform、Google Vertex AIを通じて提供される予定です。

Cosmos Reasonはbuild.nvidia.comでお試しいただくか、Hugging FaceまたはGitHubからダウンロードしてください。

Nemotron Nano 2とLlama Nemotron Super 1.5(NVFP4)は近日中にダウンロード可能になります。それまでの間、Nemotronモデルの詳細を確認し、以前のバージョンをダウンロードしてください。

Llama Nemotron VLM Dataset v1はHugging Faceからダウンロードできます。

SIGGRAPH での NVIDIA Research の特別講演をご覧ください。グラフィックスとシミュレーションのイノベーションがどのように融合して産業のデジタル化を推進するのか、NVIDIA のカンファレンス(8 月 14 日(木)まで開催)で詳しくご紹介します。

ソフトウェア製品情報については、お知らせをご覧ください。

カテゴリー: ジェネレーティブ AI
タグ: 人工知能 | Cosmos | Metropolis | Nemotron | フィジカル AI | SIGGRAPH 2025

出典: 元記事を読む

※現在お読みいただいているこの記事は、国内外のニュースソース等から取得した情報を自動翻訳した上で掲載しています。
内容には翻訳による解釈の違いが生じる場合があり、また取得時の状況により本文以外の情報や改行、表などが正しく反映されない場合がございます。
順次改善に努めてまいりますので、参考情報としてご活用いただき、必要に応じて原文の確認をおすすめいたします。

TOP
CLOSE
 
SEARCH