中国AI「DeepSeek」が新型「V4」モデル発表、国産半導体で性能向上

トレンドセッター
この記事を読むのにかかる時間: 4

この記事のポイント

  • 中国AIスタートアップDeepSeekが最新AIモデル「V4」を発表。
  • 国産半導体技術を多用し、情報処理能力が大幅に向上。
  • 米AIモデルに匹敵する性能、特に長文処理能力で優位性。
  • 国産AIエコシステムの発展と、グローバルAI競争への影響。

中国AI新星DeepSeek、最新モデル「V4」で飛躍

中国のAIスタートアップ企業であるDeepSeek(深度求索)が、最新AIモデル「V4」の提供を開始しました。このモデルは、国産半導体技術を統合的に活用して開発されており、大量の情報を同時に処理する能力が大幅に向上しています。その性能は、アメリカの最新AIモデルに匹敵するレベルに達しているとされています。

国産半導体の活用と性能向上

DeepSeekは、V4の開発において、中国の大手通信機器メーカーであるファーウェイ(Huawei)などが提供する国産半導体チップを採用したと推測されています。これらのチップは、AIモデルが推論を行うタスクだけでなく、技術的に要求が高いとされるモデルの学習段階でも使用されているとのことです。

「R1」に続く待望の大型モデル

DeepSeekは、2025年1月に発表した低コストかつ高性能なAIモデル「R1」で世界的に注目を集めました。V4は、既存モデルの改良版を除けば、R1以来の待望の新型AIモデルとなります。

V4-Proの圧倒的なパラメータ数と長文処理能力

V4モデルの「Pro」バージョンは、AIの性能指標となるパラメータ数が1.6兆個に達します。これは、2024年12月に発表された前世代のV3と比較して1.4倍の増加です。このモデルは、企業内の複雑な規程変更などにも対応し、規程全体の一貫性を保ちながら、内部矛盾の発生を効果的に防止する能力を持っています。

主要米AIモデルとの比較

DeepSeekは、V4と、Anthropic社の「Claude 3.5 Opus」、Google社の「Gemini 1.5 Pro」、OpenAI社の「GPT-4o」といった主要なアメリカ製AIモデルとの性能比較データを公開しています。DeepSeekによると、V4は自律型エージェント機能や知識検索性能において、これらの米AIモデルと同等のレベルに達しており、推論能力も世界最高水準とのことです。

「V4-Flash」と「V4-Pro」の基本情報

DeepSeekは、V4-FlashとV4-Proという2つのモデルを発表しました。これらのモデルは、最大38.4万トークンという、GPT-4o(最大128kトークン)やGPT-4o mini(最大128kトークン)を大幅に上回る出力処理能力を持っています。この「グローバルリーダー」とも言われる長文コンテキスト能力は、「計算・ストレージコストの大幅な削減」にも繋がるとされています。

長文処理の商業利用への期待

艾媒諮詢(iiMedia Research)の創業者である張毅氏は、超長文コンテキストのサポートが標準化されれば、長文テキスト処理が高度な専門研究室から商業利用へと移行する可能性を指摘しています。香港の「Contrastive Law」技術市場調査会社の副社長、ニール・シャー氏もこの見解に同意し、DeepSeekの推論コスト管理能力の高さを示すものだと評価しています。

ファーウェイ製チップの採用

DeepSeekの新しいオープンソースモデルが、初めてファーウェイ製のプロセッサを採用したことも注目されています。このプロセッサは、ファーウェイが独自開発した「Ascend」アーキテクチャに基づいています。

AI開発競争と投資動向

DeepSeekは、2025年に発表したR1モデルで、OpenAIなどに匹敵する性能を持ちながら開発コストを大幅に抑えることで、AI開発への巨額投資の妥当性について議論を巻き起こしました。しかしその後もAIへの投資は増加しており、米テック企業は2026年にAIインフラとデータセンターに約6500億ドルを投資すると見られています。

国産チップサプライチェーンの展望

ファーウェイの次世代チップ「Ascend 910B」および「Ascend 910C」は、年末までに市場投入される見込みです。DeepSeekは、V4モデルのサービススループット問題が、この「Ascend 910B」の量産開始時期と重なると説明しています。これは、中国のAIモデル企業が、外国製チップから国産代替チップへと移行する大きなトレンドを反映しています。ファーウェイ以外にも、中国のチップ設計企業であるMoore ThreadsやCambriconも、V4モデルとの「ゼロディ」アダプテーションを完了したと発表しています。

テンセントによるV4モデルの導入

テンセント(Tencent)は、TokenHub大模型サービスプラットフォームにV4モデルを導入した最初のローカルクラウドサービスプロバイダーの一つとなりました。同社のTokenHubプラットフォームは、複数の国産チップメーカーのチップで駆動されているとのことです。

グローバルAI競争への影響

NVIDIAのCEOであるジェンスン・フアン氏は、DeepSeekの最新モデルがファーウェイのチップ上で最適化された場合、米国にとって「恐ろしい結果」になると述べています。また、著名なAIブロガーであるサイモン・ウィルソン氏は、新しいDeepSeekモデルが世界の「大規模最先端モデルの中で最も安価」であると指摘しています。

DeepSeek V4の競争力と今後の課題

DeepSeekは、V4が主要な米国のクローズドモデルと比較して全体的に競争力があるとしつつも、推論能力においては「約3〜6ヶ月遅れている」と分析しています。これは、中国AI産業の急速な発展と、グローバルAI市場における競争の激化を示唆しています。

出典: 元記事を読む

この記事で取り上げた分野では、現在も採用が活発です。以下は、semicon.todayの編集部が記事のテーマをもとに選定した求人情報です。広告・PRではありません
※採用状況により求人内容が更新される場合があります

※現在お読みいただいているこの記事は、国内外のニュースソース等から取得した情報を自動翻訳した上で掲載しています。
内容には翻訳による解釈の違いが生じる場合があり、また取得時の状況により本文以外の情報や改行、表などが正しく反映されない場合がございます。
順次改善に努めてまいりますので、参考情報としてご活用いただき、必要に応じて原文の確認をおすすめいたします。

TOP
CLOSE
 
SEARCH