中国のAI業界はイノベーションのペースを加速させている。

トレンドセッター
この記事を読むのにかかる時間: 4

◎本紙記者 杜鵬

春節が近づくにつれ、AI業界の競争は激化しています。今年に入ってから、百度(バイドゥ)、アリババ、ディープシークは、基盤となる大規模モデルを中心とした新技術・新製品を次々と発表し、AIイノベーションにおける優位性確保への取り組みを加速させています。

百度は1月22日、ネイティブフルモーダル統合モデリング技術を採用し、テキスト、画像、音声、動画など、様々な情報の入出力をサポートする「文心大規模モデル5.0」の正式版をリリースしました。アリババは1月26日、主力推論モデル「Qwen3-Max-Thinking」をリリースし、推論技術の革新と飛躍的な性能向上を実現しました。続いて、ディープシークは新モデル「DeepSeek-OCR-2」をリリースし、オープンソース化しました。業界専門家は、中国のAI業界が短期間で「三勢力均衡」に突入し、イノベーションのペースが大幅に加速したと見ています。

AI応用能力の上限は、基盤となる大規模モデルの進化によって決まります。ネイティブフルモーダルアーキテクチャを備えた文心大規模モデル5.0正式版は、技術革新をリードし、競争優位性を築きます。百度の担当者は、業界標準のマルチモーダルソリューションのほとんどが「ポストフュージョン」を採用しているのに対し、文心大規模モデル5.0正式版は、ネイティブフルモーダルモデリングに統合自己回帰アーキテクチャを採用していると説明しました。このモデルは、テキスト、画像、動画、音声などのマルチソースデータを同一のモデルフレームワーク内で共同学習することで、統合アーキテクチャの下でマルチモーダル機能の完全な融合と協調最適化を可能にし、ネイティブフルモーダルの統合的な理解と生成を実現します。先日発表されたLMARaenaグローバル大規模モデルアリーナランキングにおいて、Wenxin Big Model 5.0正式版は、テキスト理解と画像理解の両方で中国で繰り返し1位を獲得し、国際的にトップクラスの地位を確立しました。

アリババも千聞ビッグモデルへの投資を継続的に行っています。最新の推論モデルであるQwen3-Max-Thinkingは、新たなテスト時間延長メカニズムを採用し、同一コンテキスト内でより効率的な推論計算を可能にし、よりインテリジェントで経済的な推論結果をもたらします。さらに、アリババはアプリケーションエコシステムとトラフィックの優位性を活かし、千聞ビッグモデルを自社の強みであるeコマース、旅行、決済サービスと統合し、Taobao、Alipay、Fliggyなどのプラットフォームと緊密に連携することで、テクノロジーとシナリオの効率的な連携を実現しています。業界専門家によると、強力な独自のビジネスエコシステムを活用して包括的に展開するBaiduやAlibabaとは異なり、DeepSeekはオープンソースの優位性を重視し、モデルの基盤となる機能とオープンエコシステムの構築に注力しています。 「モデルの重み + トレーニングフレームワーク + デプロイメントツール」というフルスタックのオープンソース化により、コスト効率を最大化しています。

DeepSeekの最新リリースであるDeepSeek-OCR-2は、革新的なDeepEncoder V2方式を採用し、画像の意味に応じて画像部分を動的に並べ替えることが可能です。これは人間の視覚的な論理的な流れをシミュレートし、複雑な画像を処理する際の知能と論理性を高め、独自の技術革新を示しています。

1月29日、BaiduはDeepSeek-OCR-2への対応として、テキスト認識技術の派生モデルであるPaddle OCR-VL-1.5を迅速にリリースし、オープンソース化しました。Paddle OCR-VL-1.5は、OCR(光学式文字認識)モデルにおける「不規則ボックスローカリゼーション」技術の先駆者であり、反り、折り目、またはカールしたエッジを持つ不規則な形状の文書を正確に認識します。

Baiduの担当者は、フルスタックAI機能を備えた数少ない企業の一つとして、ソフトウェアとハ​​ードウェアの相乗効果とシナリオベースの実装に継続的な投資を行い、主要プレーヤー間の競争において強力なレジリエンスを発揮してきたと説明した。

基盤となるハードウェア面では、自社事業における極めて高いコンピューティングパワーへの需要に支えられ、BaiduのAIチップブランドであるKunlun Chipは、専用から汎用へ、社内サポートから外部サービスへと、あらゆる方向へと進化を遂げ、シナリオ定義型チップの実現可能性を実証してきた。最近、独立したIPOプロセスを開始し、多分野展開を加速させている。現在、Baiduは中国初となる完全自社開発の3万枚構成のKunlun Chipクラスターをリリースした。このクラスターは、数千億のパラメータを持つ複数の大規模モデルの同時学習をサポートし、「実用的」から「拡張可能で複製可能な」自社開発コンピューティングパワーへと飛躍を遂げている。

信頼性の高い基盤コンピューティング能力、先進的なクラウドサービス、そして強力なモデル機能により、より豊富な製品サービスが実現しています。百度は、文心基本大規模モデルをベースに、マトリックスモデルと特化モデルを構築しました。マトリックスモデルは製品レベルのアプリケーションや一般的なシナリオへの迅速な導入に適しており、特化モデルは業界アプリケーションや垂直シナリオに適しています。例えば、文心デジタルヒューマン大規模モデルは、ライブストリーミングeコマースなどの分野で既に大規模な応用を実現し、新たなインタラクティブ体験とコンテンツフォーマットを生み出しています。2025年の「双十一」ショッピングフェスティバルでは、デジタルヒューマンライブストリーミングによる商品取引総額が前年比91%増、ライブストリーミングルーム数が119%増加し、10万以上の加盟店がサービスを利用しました。

2025年の春節(旧正月)でDeepSeekが注目を集めて以来、中国のAIは国際的なテクノロジー分野で大きな話題となっています。 1年以上の開発期間を経て、AI技術は我が国において大規模導入の新たな段階に入りつつあり、その価値は産業変革の推進とより広範な社会貢献においてさらに実証されつつあります。企業によって発展の道筋は異なりますが、イノベーション能力の向上という明確な道筋は共通しており、中国のAI産業を「追いつく」段階から「先導する」段階へと共に推進しています。

(編集者:王万英)

出典:中国経済網

出典: 元記事を読む

この記事に関連するおすすめ求人特集:

※最新の採用状況により、リンク先の求人が更新されている場合があります。

※現在お読みいただいているこの記事は、国内外のニュースソース等から取得した情報を自動翻訳した上で掲載しています。
内容には翻訳による解釈の違いが生じる場合があり、また取得時の状況により本文以外の情報や改行、表などが正しく反映されない場合がございます。
順次改善に努めてまいりますので、参考情報としてご活用いただき、必要に応じて原文の確認をおすすめいたします。

TOP
CLOSE
 
SEARCH