NVIDIA RTX、LTX-2 と ComfyUI のアップグレードにより PC での 4K AI ビデオ生成を高速化

トレンドセッター
この記事を読むのにかかる時間: 6

2025年はPCにおけるAI開発にとって飛躍の年となりました。

PCクラスの小規模言語モデル(SLM)の精度は2024年と比較して約2倍向上し、最先端のクラウドベースの大規模言語モデル(LLM)との差を劇的に縮めました。Ollama、ComfyUI、llama.cpp、UnslothといったAI PC開発ツールは成熟し、その人気は前年比で倍増し、PCクラスのモデルをダウンロードするユーザー数は2024年と比較して10倍に増加しました。

これらの開発により、生成AIが今年、PCクリエイター、ゲーマー、そして生産性向上を目指すユーザーの間で広く普及する道が開かれています。

今週のCESで、NVIDIAはGeForce RTX、NVIDIA RTX PRO、NVIDIA DGX Sparkデバイス向けのAIアップグレードを順次発表します。これらのアップグレードにより、開発者がPC上で生成AIを展開するために必要なパフォーマンスとメモリ容量が解放されます。内容は以下の通りです。

PyTorch-CUDA最適化とComfyUIのネイティブNVFP4/FP8精度サポートにより、ビデオおよび画像生成AIのパフォーマンスが最大3倍向上し、VRAM容量が60%削減されます。
ComfyUIへのRTXビデオ超解像の統合により、4Kビデオ生成が高速化されます。
Lightricksの最先端LTX-2オーディオビデオ生成モデルのオープンウェイトリリース向けのNVIDIA NVFP8最適化。
Blenderの3Dシーンを使用して4K AIビデオを生成するための新しいビデオ生成パイプラインにより、出力を正確に制御できます。
Ollamaとllama.cppにより、SLMの推論パフォーマンスが最大35%高速化されます。
Nexa.ai の Hyperlink 新機能ビデオ検索機能向けの RTX アクセラレーション。

これらの進化により、ユーザーは、ローカル RTX AI PC が提供するプライバシー、セキュリティ、低遅延を維持しながら、高度なビデオ、画像、言語 AI ワークフローをシームレスに実行できるようになります。

RTX PC で 3 倍の速度と 4K 画質のビデオを生成

生成 AI は素晴らしいビデオを作成できますが、オンラインツールをプロンプトだけで制御するのは難しい場合があります。また、ほとんどのモデルは PC の VRAM に収まらないほど大きいため、4K ビデオの生成はほぼ不可能です。

本日、NVIDIA は RTX を活用したビデオ生成パイプラインを発表しました。このパイプラインにより、アーティストはビデオ生成を正確に制御しながら、3 倍の速度でビデオを生成し、4K にアップスケールできます。しかも、VRAM のごく一部しか使用しません。

このビデオ パイプラインにより、新進アーティストはストーリーボードを作成し、それをフォトリアリスティックなキーフレームに変換し、さらにこれらのキーフレームを高品質の 4K ビデオに変換できます。パイプラインは3つのブループリントに分かれており、アーティストは必要に応じて組み合わせたり変更したりできます。

シーンのアセットを作成する3Dオブジェクトジェネレーター。

ユーザーがBlenderでシーンを設定し、そこからフォトリアリスティックなキーフレームを生成できる3Dガイド付き画像ジェネレーター。
ユーザーの開始キーフレームと終了キーフレームに従ってビデオをアニメーション化し、NVIDIA RTX Videoテクノロジを使用して4Kにアップスケールするビデオジェネレーター。

このパイプラインは、Lightricksの画期的な新モデルLTX-2によって実現しました。LTX-2は、本日ダウンロード可能です。

ローカルAIビデオ作成における大きなマイルストーンとなるLTX-2は、主要なクラウドベースモデルに匹敵する結果を提供しながら、最大20秒間の4Kビデオを優れた視覚的忠実度で生成します。このモデルは、組み込みオーディオ、マルチキーフレームサポート、そして制御可能な低ランク適応によって強化された高度なコンディショニング機能を備えており、クリエイターはクラウド依存に依存せずに映画レベルの品質と制御性を実現できます。

パイプラインは内部的にComfyUIによって駆動されています。過去数ヶ月にわたり、NVIDIAはComfyUIと緊密に連携し、NVIDIA GPUのパフォーマンスを40%最適化してきました。最新のアップデートでは、NVFP4およびNVFP8データ形式のサポートが追加されました。RTX 50シリーズのNVFP4形式ではパフォーマンスが3倍高速化し、VRAMは60%削減されます。また、NVFP8形式ではパフォーマンスが2倍高速化し、VRAMは40%削減されます。

NVFP4およびNVFP8チェックポイントは、一部の主要モデルのComfyUIから直接利用できるようになりました。これらのモデルには、LightricksのLTX-2、Black Forest LabsのFLUX.1とFLUX.2、AlibabaのQwen-ImageとZ-Imageが含まれます。これらのモデルはComfyUIから直接ダウンロードでき、近日中に追加のモデルのサポートも開始されます。

ビデオクリップが生成されると、ComfyUI の新しい RTX ビデオノードを使用して、わずか数秒でビデオが 4K にアップスケールされます。このアップスケーラーはリアルタイムで動作し、エッジをシャープにし、圧縮アーティファクトを除去して、クリアな最終画像を実現します。RTX ビデオは来月 ComfyUI で利用可能になります。

ユーザーが GPU メモリの限界を超えられるよう、NVIDIA は ComfyUI と連携し、ウェイトストリーミングと呼ばれるメモリオフロード機能を改良しました。ウェイトストリーミングを有効にすると、ComfyUI は VRAM が不足したときにシステム RAM を利用できるため、ミッドレンジの RTX GPU でより大規模なモデルとより複雑な多段ノードグラフを実現できます。

ビデオ生成ワークフローは来月ダウンロード可能になり、新たにリリースされた LTX-2 ビデオモデルのオープンウェイトと ComfyUI RTX アップデートは現在利用可能です。

PC ファイルとビデオを検索する新しい方法

PC でのファイル検索は、何十年も変わっていませんでした。依然としてファイル名と不完全なメタデータに大きく依存しているため、昨年の文書を1つ見つけ出すのが、本来よりもはるかに困難になっています。

Nexa.aiの​​ローカル検索エージェントであるHyperlinkは、RTX PCを検索可能なナレッジベースに変え、インライン引用を使用して自然言語で質問に答えることができます。文書、スライド、PDF、画像をスキャンしてインデックス付けできるため、ファイル名を推測するのではなく、アイデアやコンテンツに基づいた検索が可能になります。すべてのデータはローカルで処理され、プライバシーとセキュリティを確保するためにユーザーのPC上に保存されます。さらに、RTXアクセラレーションにより、テキストファイルと画像ファイルのインデックス作成は1ギガバイトあたり30秒、RTX 5090 GPUでは応答時間は3秒です。一方、CPUではファイルのインデックス作成に1ギガバイトあたり1時間、応答時間は90秒かかります。

CESで、Nexa.aiはHyperlinkの新しいベータ版を発表します。このバージョンでは動画コンテンツのサポートが追加され、動画内のオブジェクト、アクション、音声を検索できるようになります。これは、Bロールを探しているビデオアーティストから、バトルロイヤルの試合で勝利した瞬間を見つけて友人と共有したいゲーマーまで、幅広いユーザーに最適です。

Hyperlinkプライベートベータ版をお試しになりたい方は、こちらのウェブページでアクセス登録を行ってください。アクセスは今月から開始されます。

小規模言語モデルが35%高速化

NVIDIAはオープンソースコミュニティと協力し、Llama.cppとOllamaを使用したRTX GPUおよびNVIDIA DGX Sparkデスクトップスーパーコンピューター上のSLMのパフォーマンスを大幅に向上させました。最新の変更は、新しいNVIDIA Nemotron 3オープンモデルファミリーを含む、専門家混合モデルに特に効果的です。

SLM推論パフォーマンスは、過去4か月間でllama.cppで35%、Ollamaで30%向上しました。これらのアップデートは現在利用可能で、llama.cppのQoL(使いやすさ)向上アップグレードにより、LLMの読み込み時間も高速化されています。

これらの高速化は、LM Studio の次期アップデートで利用可能になり、新しい MSI AI Robot アプリなどのエージェントアプリにも近日中に導入される予定です。Llama.cpp の最適化も活用する MSI AI Robot アプリは、ユーザーが MSI デバイスの設定を制御できるようにし、今後のリリースで最新のアップデートを組み込む予定です。

NVIDIA Broadcast 2.1 により、より多くの PC ユーザーがバーチャルキーライトを利用できるようになりました

NVIDIA Broadcast アプリは、AI エフェクトにより PC のマイクとウェブカメラの画質を向上させ、ライブストリーミングやビデオ会議に最適です。

バージョン 2.1 では、バーチャルキーライト エフェクトが更新され、パフォーマンスが向上しました。RTX 3060 以上のデスクトップ GPU で利用可能になり、より多くの照明条件に対応できるようになり、より幅広い色温度制御が可能になりました。また、プロのストリーミングでよく見られる 2 つのキーライト スタイルを実現するために、更新された HDRi ベースマップも使用できるようになりました。NVIDIA Broadcast アップデートを今すぐダウンロードしてください。

DGX Spark で自宅のクリエイティブスタジオを AI の拠点に

毎月、高性能で進化を続ける新しい AI モデルが PC に登場し、より強力で柔軟なローカル AI 環境への開発者の関心は高まり続けています。DGX Spark は、ユーザーのデスクに収まり、メインのデスクトップ PC やノート PC とシームレスに連携するコンパクトな AI スーパーコンピューターです。既存の PC と連携して、高度な AI ワークロードの実験、プロトタイピング、実行を可能にします。

Spark は、LLM のテストやエージェント型ワークフローのプロトタイピングに関心のある方、あるいはワークフローと並行してアセットを生成し、メイン PC を編集用に使い続けたいアーティストにとって理想的なソリューションです。

CES で、NVIDIA は Spark の AI パフォーマンスを大幅に向上させるアップデートを発表しました。これにより、発売からわずか 3 か月で最大 2.6 倍のパフォーマンス向上が実現します。

新しい DGX Spark プレイブックも提供されており、投機的デコード用や、2 つの DGX Spark モジュールを使用してモデルを微調整するためのプレイブックなどが含まれています。

Facebook、Instagram、TikTok、X で NVIDIA AI PC をフォローしましょう。RTX AI PC ニュースレターにご登録いただくと、最新情報を入手できます。LinkedIn と X で NVIDIA Workstation をフォローしてください。

ソフトウェア製品情報に関するお知らせをご覧ください。

カテゴリー: ジェネレーティブ AI
タグ: 人工知能 | CES 2026 | クリエイター | GeForce RTX | NVIDIA RTX | レンダリング | RTX AI Garage

出典: 元記事を読む

※現在お読みいただいているこの記事は、国内外のニュースソース等から取得した情報を自動翻訳した上で掲載しています。
内容には翻訳による解釈の違いが生じる場合があり、また取得時の状況により本文以外の情報や改行、表などが正しく反映されない場合がございます。
順次改善に努めてまいりますので、参考情報としてご活用いただき、必要に応じて原文の確認をおすすめいたします。

TOP
CLOSE
 
SEARCH