中国国家天文台とアリババクラウドが、世界初の太陽フレア予測に特化した大規模AIモデル「金烏」を共同発表。従来の手作業では困難だった膨大な観測データを処理し、M5クラスのフレアで91%超の予測精度を実現。宇宙空間の安全保障にAIが新たな力をもたらす。
バイドゥの深層学習フレームワーク「PaddlePaddle(飛槳)」が3.0正式版を公開。自動並列化や大規模モデル対応、高次自動微分、神経ネットワークコンパイラ、多種チップへの適応性を強化し、AIの産業化と科学研究の両面で開発者を支援する。
アントグループと清華大学が共同開発したRL訓練フレームワーク「AReaL-boba」が公開された。わずか200ドル・200件のデータでSOTA級の数学推理AI「QwQ-32B」を再現可能で、コードやデータも完全公開されている。中小規模チームでも短期間で高性能モデルを構築できる新たな訓練パラダイムとして注目を集めている。
人型ロボット開発で注目されるUniTree(宇樹科技)が、アントグループとチャイナモバイル(中国移動)から戦略投資を受ける見込みとなった。評価額は前回と同水準の約80億元(約1,600億円)。四足ロボットで世界的なシェアを持つ同社には今後、政府・企業向けの商用展開が期待される。一方で、業界全体の投資過熱に対する懸念も強まっている。
中国のAI企業Zhipu(智譜)は、中関村フォーラムで次世代エージェント「AutoGLM 沉思」を発表。検索・分析・実行を統合し、ChatGPTの有料機能に匹敵する性能を無料提供。中核技術は4月14日にオープンソース化予定で、業界全体への波及が期待される。
バイドゥのAIアシスタント「MiniGen(文小言)」が、複数の大規模言語モデルを統合する新機能と、方言対応の音声大モデル、画像問答機能を備えて進化。音声・視覚の両面で高精度かつ柔軟な対話体験を実現し、家庭用から専門用途まで幅広く対応可能となった。
CAMEL-AIは、次世代の強化学習エージェント開発に向けて、プロンプト工学依存から脱却し、動的・構造的な学習環境の構築に注力している。スケーリング則、環境設計、進化適応を軸に、RLエージェントの基盤整備を進める。
バイトダンスは、軽量高性能な音声合成モデル「MegaTTS3」をオープンソースで公開。0.45Bパラメータながら高品質な音声クローンや中英混合発音に対応し、柔軟なアクセント制御も可能なTTSモデルとして注目を集めている。
香港上場のAIGC先駆企業「Mobvoi(出門問問)」が、初の年次報告でAIGC事業の売上が前年比88.5%増の2.2億元(約45億円)に達したと発表。全体収入の56.8%を占める中核事業となり、海外売上比率も4割超に拡大。プロジェクト型からサブスクリプション型への転換と海外戦略が奏功した。
AIエージェントManusがスマホアプリを公開し、Claude 3.7を採用した新バージョンを展開中。急成長する一方でサーバーコストが課題となり、5億ドルの評価額で新たな資金調達を模索。多国でユーザーイベントを開催し、機能強化と市場拡大を進めている。
ModelBest(面壁智能)が純端末動作型のAIアシスタント「MiniCPM(小鋼炮)スーパーアシスタント」を発表。完全ローカル実行とミリ秒応答を実現する高性能モデルを基盤に、プライバシー保護と脱クラウド対応を強みに、車載AIの次世代標準を目指す。
RuoYi AIは、Javaベースで構築されたフルスタック型AIアシスタント開発用プラットフォーム。多モーダル対応、LLM連携、RAG機能、商用可能なMITライセンスを備え、開発者が迅速に独自のAIサービスを構築できる環境を提供する。
清華大学出身の胡渊鳴が率いるMeshy.AIが、AIによる3Dモデル生成で世界的な注目を集めている。ゲーム・映像制作における3D生成の品質と生産性を大幅に向上させ、「生産準備レベル」へと進化。今後の産業構造を変える可能性が高い。
Doubao(豆包)は、推論と検索を融合した「Deep Thinking(深度思考)」機能の新バージョンをテスト開始。考えながら検索することで、多段階推論と外部情報の統合により、より精度の高い回答を実現する。
アリババのTongyi Labが、視覚推論に特化したAI「QVQ-Max」の初版を正式公開。画像や動画を読み取り、背景知識をもとに論理的に分析・推論することが可能。教育、ビジネス、創作など多分野での応用が期待される。
中国の3D生成AI企業VASTが、オープンソース強化月間の第2週において新たな基礎モデル「TripoSG」と「TripoSF」を公開。両モデルは最新の3D生成性能指標(SOTA)を更新し、入力画像から高精度な3D形状を生成可能。今後も継続的に新技術の公開を予定している。
Manus開発チームは、世界初の汎用AIエージェントとして注目されるManusを発表後わずか3週間で、約37億元(約780億円)の評価額でシリコンバレーにて資金調達を開始。教育や科学モデリングに応用できる新機能も次々と追加され、AIエージェント市場に大きな波を起こしている。
アリババのTongyi Lab(通義実験室)は、テキスト・画像・音声・動画を同時に処理・出力できる全モーダル大規模モデル「Qwen2.5-Omni-7B」をオープンソース化。独自アーキテクチャにより高精度かつリアルタイムな認識と対話を可能とし、Google Gemini-1.5-Proを超える性能を記録した。
アリババ、テンセント、バイトダンスがAI戦略を本格化させ、中国テック大手による「AIスーパーアプリ」争奪戦が始動。DeepSeekの登場を契機に、各社は検索、SNS、コンテンツといった強みを活かし、AI時代の主導権を狙う。
動画プラットフォームBilibiliが、中国語特化の高性能TTSモデル「IndexTTS」を2025年3月にオープンソース公開。多音字処理や発音の自然さで従来モデルを上回り、仮想配信や教育用途など幅広い応用が期待されている。
Qihoo 360(奇虎360)が発表した「Light-R1-14B-DS」は、DeepSeekの強化学習効果を14Bスケールで再現した初の推論モデル。性能は32B・70B級モデルを凌駕し、コストを約1000ドルに抑えながら、数学推論における大幅な精度向上を実現。学習データとコードも公開され、再現性と応用性が高い。
Kunlun Tech(昆侖万維)は、独自技術「MusiCoT」を搭載した世界初の音楽推論大規模モデル「Mureka O1」を発表。楽曲構造の整合性と創造性を飛躍的に高め、APIおよびモデル微調整機能の公開により、AI音楽開発のグローバルエコシステム構築を本格化している。
2025年設立のAI具身知能スタートアップTARS(它石智航)が、設立50日で中国最大規模となる1.2億ドル(約180億円)のエンジェルラウンドを達成。ファーウェイやバイドゥの技術者によるフルスタック体制で、物理世界と汎用ロボティクスの融合による次世代AIの社会実装を目指す。
中国のAI企業DeepSeekが、事前告知なしにV3モデル(V3-0324)をアップデート。JavaScriptやTypeScriptへの対応が強化され、自然な対話表現も向上。6850億パラメータのオープンモデルで、企業のAI導入のハードルを下げる狙いがある。
DeepSeekがV3モデルの小規模アップデートを発表。フロントエンド開発能力が大幅に向上し、Claude 3.7に匹敵する性能を実現。加えて、MITライセンスの採用により商用利用の自由度も高まった。
AMDのMI300Xが、生成AIモデルDeepSeek-R1の推論においてNVIDIA H200を大幅に上回る性能を示した。SGLangフレームワークとAIカーネルライブラリAITERの最適化が鍵となり、128並列でも遅延は50ms以下、スループットはH200の最大5倍に達した。
アリババのTongyi Lab(通義実験室)は、動画生成AIモデル「Wan」シリーズに関する詳細技術レポートを公開。推論速度や生成品質を大幅に向上させた独自技術を採用し、オープンソースコミュニティへの貢献と実用性を両立させた開発成果が注目を集めている。
DeepSeek AIは、大型言語モデル「DeepSeek-V3」の新バージョン「V3-0324」を公開。強化学習手法の導入により、推理・数学・コーディング・中国語生成・検索能力などで性能が大幅向上。API仕様は従来通りで、オープンソースモデルも提供開始。
アリババのTongyi Lab(通義実験室)は、画像理解と数学推論能力を備えたマルチモーダルモデル「Qwen2.5-VL-32B-Instruct」を公開。ローカル実行可能で、Hugging Faceなど複数のプラットフォームから利用できる。強化学習により人間らしい応答や高精度な視覚認識を実現。
Wenxiaobai(問小白)開発チームは、RAG(検索拡張生成)能力に関する最新技術成果を公開。Chinese SimpleQAでF-score 91.6%を達成し、GPT-4oを含む他モデルを凌駕した。情報精度と安定性の両立が高評価の要因となった。
バイドゥ(百度)は3月24日の「百度AI Day」で、生成型AIアプリ開発ツール「Miaoda(秒噠)」の正式公開を発表した。コード不要で複雑なアプリも開発できるノーコードツールで、複数のAIエージェントが自然言語での指示に応じて協調作業を行う。既に2万社以上が試験導入している。
アリババのTongyi Lab(通義実験室)が、最新の動画生成モデル「Wan(通義万相)2.1」の技術報告を公開。分布式学習、軽量化、推論加速、大規模データ構築などで革新を実現し、ベンチマークでSoraを上回る性能を記録。オープンソース動画生成の分野をけん引する存在となっている。
アリババの大規模言語モデル基盤Qwen(通義千問)は、イギリス・シンガポール・日本の海外スタートアップで導入が進み、日本では東京大学発の企業が日本語専用モデルを開発。中国国内では、政府の重点支援を受ける大学群が最新モデルQWQ-32Bを研究・教育に導入しており、Qwenシリーズは世界最大級のオープンソースモデル群として展開されている。
テンセントは自社開発の深度思考モデル「Hunyuan T1(混元T1)」正式版を発表。数学・論理・科学分野の難問に特化し、推理力を強化。長文処理に優れ、業界初のHybrid-Mamba-Transformer構造を採用しながら、計算コストとリソース使用を大幅に削減した。
中国・ROBAM(老板電器)が開発した世界初のAI料理モデル「食神」は、DeepSeekを搭載し、マルチモーダル能力を活用して健康状態や食材に応じた個別レシピを自動生成。デジタル調理機器との連携により、自動調理や音声ガイドにも対応し、誰でも手軽に本格料理を実現可能にした。
LangManusは自然言語でネット検索からコード実行、レポート生成まで自動化できるオープンソースAIエージェント。専用Web UIも公開され、誰でも簡単に高度なタスク処理を行える環境を提供する。
中国政府は2025年9月1日から、AI生成コンテンツに「AI生成」と明示・暗示の識別を義務付ける新制度を施行する。技術濫用による誤情報や詐欺、創作物の盗用を防ぎ、ユーザーの知る権利と産業の健全な競争環境を守ることが狙いとされる。
Zeelin(智霊動力)は、マルチモーダル技術と混合アーキテクチャを組み合わせたAIエージェントプラットフォーム。研究・文創分野に特化し、五種の垂直型エージェントを通じてひと言の指令で高精度なコンテンツを生成。人機共生を掲げ、10万以上のユーザーを獲得。
北京市が推進するデジタル経済都市構想の中で、生成AI「Monica」が国内製品として正式に登録された。北京ではすでに105の大規模モデルが登録済みで、全国最多となっている。
01.AI(零一万物)CEOの李開復がBloombergに語ったところによると、中国における大規模AIモデルの開発は寡頭化が進み、DeepSeek・アリババ・バイトダンスの3社に集約される見通し。01.AIは企業向けにDeepSeekの実用化を支援するプラットフォームを開発し、AI応用の本格展開を後押ししている。
バイトダンス(字節跳動)は、視覚と言語を統合したモデル「UI-TARS」を基盤とする多機能AIエージェント「TARS」を開発し、オープンソースとしてGitHub上で公開した。TARSはブラウザ操作、コマンドライン、ファイル管理などを統合し、複雑なタスクを自律的に実行できる点が特徴。
中国AI企業StepFun(階躍星辰)は、画像から動画を生成する新モデル「Step-Video-TI2V」をオープンソース公開。動きの強さやカメラワークを細かく制御でき、アニメや短編映像制作に適応。HuaweiのAscend(昇騰)チップにも最適化済みで、技術レポートやコードも公開中。
CVPR 2025に採択されたマルチインスタンス拡散モデル「MIDI-3D」が2025年3月にオープンソースとして公開された。単一画像から複数の3Dインスタンスを同時生成し、高速かつ高品質な3Dシーン再構成を実現。モデル重み・コード・デモが利用可能。
Baichuan AI(百川智能)は北京儿童医院と共同で、世界初となる小児科向け大規模AIモデル「福棠·百川」を発表。専門医の知識と経験を統合し、循証医学に基づいた診療支援を実現。基層から専門医療まで対応するAI製品を開発し、小児医療の地域格差解消に取り組む。
TikTokの元アルゴリズム責任者・陳志傑(Chen Zhijie)が新会社「言創万物(YanChuang WanWu)」を創業し、AI Coding分野に注力している。共同創業者には元バイドゥ(百度)のEC開発責任者・劉暁春(Liu Xiaochun)が参加。動画生成ではなく、実用性の高いAI Codingを選択した。
Larkの多次元表機能に、Moonshot AIのKimiを活用した「Kimi採用アシスタント」が追加された。履歴書の情報抽出、職務要件とのマッチング評価、面接アドバイス生成までを自動化し、HR業務の効率化を支援するツール。今後も機能拡充を予定している。
テンセントの「Hunyuan(混元)」が、世界中の大規模言語モデルが競うChatbot Arenaランキングで初の13位にランクイン。ユーザー投票ベースの実力評価に加え、SuperCLUEベンチマークでも高スコアを記録し、中国国内での実用性と推論能力の両面で存在感を示している。
CAMELは、多様なツールキットを通じてAIエージェントの外部サービス接続と機能拡張を可能にするフレームワーク。情報検索、学術研究、金融、メディア処理など、実用性の高い機能が統合され、複雑なAIシステムの開発と運用を大幅に効率化する。
テンセントは、3D生成AI「Hunyuan3D-2.0」に基づく5つの最新モデルを2025年3月18日に完全開源した。Turbo、Mini、Multi-viewなど各モデルは高速・高精度・軽量性を兼ね備え、GitHubではコードや実行方法も公開。クリエイターや研究者に向けた柔軟な応用が可能となっている。
Kunlun Tech(昆崙万維)が中国初のオープンソース・マルチモーダル推論モデル「Skywork R1V」を発表。視覚情報に対し思考の連鎖による推論を行う能力を備え、論理・数学・科学的な画像理解まで対応。高度な推論性能と汎用性を備えた次世代AIモデルとして注目される。
バイドゥ(百度)は次世代マルチモーダル大規模モデル「ERNIE(文心大模型)4.5」と、ツール活用機能を備えた思考型モデル「ERNIE(文心大模型)X1」を同時発表。両モデルは文心一言公式サイトにて無料公開され、API利用も可能。理解力や論理性、生成能力を大幅に強化している。
CAMEL-AIが開発した「OWL」は、マルチエージェントによるタスク自動化を実現する先進的なフレームワーク。ブラウザ操作、コード実行、旅行プラン作成など多様な作業を協調的に処理し、高い拡張性と実用性を備える。
中国AIスタートアップDeepSeekは、2月に初の損益分岐点を突破したが、創業者の梁文鋒(Liang Wenfeng)はAGI開発を最優先とし、外部からの資金調達や短期的な商業化を拒否している。低コスト高性能のR1モデルに注目が集まる中、大手テック企業との一線を画す姿勢を貫いている。
CAMEL-AIが開発したマルチエージェント協調フレームワーク「OWL」は、MCPプロトコルを活用して外部ツールと高効率に連携する仕組みを構築。人間の協業を模倣することでAIによるタスク自動化を加速させ、GAIAベンチマークで最高評価を記録した。
miHoYo創業者・蔡浩宇が立ち上げた新会社Anuttaconが、AI駆動の対話型ゲーム『Whispers From The Star』を発表。プレイヤーの発言がキャラクターの感情や行動をリアルタイムで変化させる。現在、iOS向けにクローズドβテストの参加者を募集している。
アリババのTongyi Lab(通義実験室)が、単一画像から高精度な3D人体アバターをわずか数秒で生成できるモデル「LHM」を発表。マルチモーダルTransformerと頭部特徴抽出の工夫により、リアルな外観とスムーズな動作を両立。コードも公開済み。
アリババが検索アプリ「Quark(夸克)」を刷新し、AI対話、検索、生成など多様な機能を一つに統合。最新のTongyi(通義)モデルを搭載し、ユーザー体験を向上させた。
バイトダンスが開発するAIアシスタント「Doubao(豆包)」に搭載された画像生成モデル「Seedream 2.0」の技術詳細が初公開。中国文化やフォントの精緻な表現に優れ、中英バイリンガル対応やRLHFによる最適化など、マルチモーダル分野で大きな進化を遂げた。
オープンソースAIプロジェクト「Open-Sora 2.0」が正式公開。11Bの大規模モデルながら、わずか224枚のGPUで訓練され、従来の10分の1以下のコストでSOTA水準の性能を実現。推論・訓練コードを含め全てがGitHub上で公開されている。
アリババのTongyi Lab(通義実験室)が、視覚・音声データを統合する感情認識LLM「R1-Omni」を公開。DeepSeek式のRLVR強化学習を全モーダルLLMに初適用し性能を大幅に向上。再現可能なコード・データ・学習済みモデルもGitHubで全公開。
生成AI「Manus」がアリババ傘下のQwen(通義千問)と戦略提携を発表し、中国国内版サービスを展開へ。新たに開発される中国語版ManusにはQwenの最新オープンソースモデル「QwQ-32B」が採用される予定で、低コストかつ高性能なモデルとして注目を集めている。
バイトダンスの豆包(Doubao)大規模モデル音声チームは、動画音声自動生成モデル「SeedFoley」を開発。動画の時空間特徴と拡散生成モデルを融合し、高精度な音声同期を実現。「即夢AI(Jimeng AI)」の「AIサウンド」機能で、動画に3つのプロ仕様の音声プランを自動生成でき、AI動画制作の質を向上させる。
2025年2月のAI製品ランキングで、アリババのQwen(通義千問)が初めてDoubao(豆包)を上回り、中国国内3位に浮上。DeepSeekは1.57億の月間アクティブユーザーを記録し、SiliconFlow(硅基流動)はDeepSeekの接続効果で40倍の急成長を遂げた。AI競争が激化する中、新規参入や既存企業の戦略が注目を集めている。
清華大学、北京大学、上海交通大学など中国の主要大学が2025年よりAI関連の本科生を大規模に増員する方針を発表。国家戦略に基づいた人材育成の一環であり、AI人材の需要拡大と企業による争奪戦が背景にある。国内AIの競争力強化を狙う。
中国発のAIエージェント「Manus」が話題を集めているが、技術面や信頼性に課題を抱える。初期ユーザーからはエラーや処理の遅さが指摘され、運用コストの高さも深刻。成功と引き換えに赤字が拡大するリスクもあり、「中国の次なるDeepSeek」となるには険しい道が続く。
清華大学AIRと水木分子は、AI駆動の生物医薬ツールキット「OpenBioMed」を発表。分子やタンパク質など多様なデータを統合解析し、薬物開発や医学研究の効率を向上させる。LLMを活用した自然言語対応機能を備え、研究プロセスを大幅に最適化。創薬から臨床研究まで幅広い応用が期待される。
Manusの登場により、エージェント分野でのオープンソース再現が活発化。特に国内のCAMEL-AIチームが開発したOWLは、DeepSeekモデルを統合し、多エージェント協調フレームワークを構築。GAIAベンチマークの検証セットでオープンソースプロジェクト中1位を獲得し、業界の注目を集めている。GitHubでもエージェント関連プロジェクトが上位を占め、競争が激化している。
中国AIスタートアップのManusが注目を集め、関連投資先4社の株価が10倍に急騰する可能性が報じられている。DeepSeekに続く次なるダークホースとして、中国本土株式市場(A株)全体を牽引する存在として期待されている。
「Open-LLM-VTuber」は、音声対話・表情認識機能・Live2Dアニメーションを統合したオープンソースのVTuber開発プラットフォーム。v1.1.0は2024年2月18日に公開され、ローカル実行と高いカスタマイズ性を備えた設計が特徴。
AI音声合成の新たな進化を遂げたSpark-TTSが登場。わずか数秒の音声サンプルでゼロショット音声クローンを実現し、音高・話速・語気・強調を細かく調整可能。Qwen-2.5連想思考技術とBiCodec音声コーデックを採用し、自然で論理的な発話を生成する。さらに、VoxBoxデータセットを活用し、少量のデータで高精度な音声合成を実現。中国語と英語のクロスランゲージ音声合成に対応し、直感的なWeb UIでの操作も可能。
2025年3月3日、テンセントのAIアシスタント「元宝(Yuanbao)」が中国のApp Store無料アプリランキングで1位を獲得した。急成長の背景には、DeepSeek-R1の完全版導入と5億元(約100億円)以上の広告投資がある。しかし、AIアシスタント市場では機能の同質化が進み、ユーザーの定着率が低い。テンセントは技術開発に加え、商業化とエコシステム構築を進め、競争力を高める必要がある。
Manusのオープンソース版「OpenManus」が、5人の開発者によってわずか3時間で再現された。完全無料で、招待コードや待ち時間も不要。モジュール化されたエージェントシステム、リアルタイムフィードバック機能、強力なツールチェーンを備え、Manusの実装手法や「パッケージ化」論争に新たな視点を提供する。
CAMEL-AIは、汎用AIエージェント「Manus」をわずか0日で再現した「OWL」を完全オープンソースで公開した。OWLはGAIAベンチマークで58.18%のスコアを達成し、HuggingfaceのOpen Deep Researchの55.15%を上回る性能を示している。Manusの高額な招待コードとは対照的に、OWLはGitHubで無料で利用可能であり、開発者が自由に利用・貢献できる環境を提供している。
アリババが推理特化型モデル「QwQ-32B」を公開、数学・コード・指示遵守能力でDeepSeek-R1を超える性能を達成。強化学習による性能向上、個人PCで動作可能な効率性、AIエージェント機能を内蔵し環境に応じて柔軟な推論を行う。
Manusは、ユーザーの思考を具体的な行動に変える汎用AIエージェントであり、多様なタスクを効率的に遂行する。GAIAベンチマークで最高性能を達成し、AI業界で大きな話題を呼んでいる。その影響で公式サイトへのアクセスが急増し、一時的な接続障害が発生している可能性がある。
Manusは独立してPC操作を行い、複雑なタスクを完成させる汎用AIエージェント。GAIAベンチマークでOpenAIを上回る性能を示す一方、革新性は限定的で、既存AI技術を再構築し非技術者向けに最適化した製品との評価もある。
テンセントは、2025年3月6日に画像から動画を生成する「HunyuanVideo-I2V」モデルをオープンソースとして公開した。ユーザーは1枚の画像と指示を入力するだけで、5秒の動画を生成可能。口パクや動作駆動機能を搭載し、2K高画質や背景音の追加にも対応。開発者向けに推論コードやLoRAトレーニングコードを公開し、GitHubやHuggingFaceで提供している。
ByteDance(字節跳動)は、約3120億ドルの評価額で米国社員の株式を買い戻す計画を発表。1株あたり約189.90ドルで、6カ月前の181ドルから上昇。外部投資家は、同社のAI戦略や製品の潜在力を評価し、評価額を4000億ドル以上に引き上げている。
中国のAI動画生成企業AIsphere(愛詩科技)がA5ラウンドで4億元(約82億円)以上の資金調達を完了した。出資はEminence Ventures(靖亜キャピタル)が単独で実施。同社の動画生成プラットフォーム「PixVerse」は、累計ユーザー数4000万人、月間アクティブユーザー数1500万人を突破。現在は海外向けに提供されているが、中国国内版のリリースも予定されている。
全国人大代表で科大訊飛董事長の劉慶峰氏が、AI産業化促進のための具体策を提言した。国産コンピューティング基盤の強化、AI教育への財政支援、高齢者向けAIサービス拡充、AI失業リスク対策、生成AIによる虚偽情報の抑制など、幅広い政策を提示し、AI社会実装の加速と安定的な発展を求めた。
滴滴自動運転(DiDi Autonomous Driving)が新たな資金調達を進め、評価額が50億ドル(約3630億円)に達する見込み。累計15.5億ドル(約1126億円)以上を調達し、北京、広州、上海で200台の自動運転車両を運用。今年中に初のRobotaxi量産車を投入予定。
MetaSo(秘塔AI)が動画検索機能を導入し、線形代数の講義やスーパーボウルの広告など、多様な動画コンテンツの検索が可能となった。新たな研究モード「先想後搜(考えてから検索)」を搭載し、各動画のクリエイティブな要点や影響力分析を提供する。
中国のAI企業・Zhipu(智譜)が、初の漢字生成に対応したオープンソースのテキストから画像生成モデル「CogView4」を発表した。DPG-Benchベンチマークで総合スコア1位を獲得し、Apache 2.0ライセンスに準拠する。最新バージョンCogView4-0304は既に公開され、3月13日に「智譜清言(chatglm.cn)」で利用可能となる。
WiseMindAIは、AIを活用した文書要約、対話、ノート作成、ポスター生成など多機能を備えた学習アシスタント。ユーザーデータを完全ローカル管理し、プライバシーを確保。ウェブ、PDF、Markdownなど10種類以上の文書形式をサポートし、没入型翻訳や知識カード機能も搭載。OpenAIやDeepSeekを含む10以上のAI大規模モデルに対応し、カスタムAIプラグインの開発・統合も可能。
iFLYTEKは、星火X1(Spark X1)をアップグレードし、数学能力を大幅に向上。医療分野向けの星火医療大規模AIモデルX1を発表し、診断や健康相談でGPT-4oやDeepSeek R1を超える性能を実現した。さらに、ファーウェイ(華為)と共同で星火(Spark)統合システムをアップグレードし、教育、医療、法務、政務、警務向けのAIソリューションを提供。AI学習機T30シリーズも導入し、教育分野でのAI活用を加速させている。
アリババが開発した大規模AIモデル「Wan2.1(万相2.1)」は、オープンソース化からわずか6日で、Hugging Faceのモデル人気ランキングとモデルスペースランキングで首位を獲得した。14Bバージョンは高性能かつ無料で提供され、多くのユーザーから高い評価を受けている。
北京大学の「DeepSeekプロンプトエンジニアリングと応用シナリオ」文書が流出し、学術界で注目を集めている。実用性に重点を置き、業務効率化や具体的な応用シナリオを詳述。一方、清華大学版は技術の深掘りとプロンプト設計理論に焦点を当てる。産業応用の課題と中国の大規模モデル開発の傾向を示す重要資料。
LiblibAIは、星流AI(Xingliu AI)と共同で「ヒットメーカー計画(爆款製造計画)」を開始し、創作者への報酬を強化する。この計画は、モデルやワークフロー、画像のクリエイターが対象で、優れたコンテンツには追加の報酬が提供される。期間は2025年2月1日から3月31日まで。
中国のAI企業・智譜AI(Zhipu AI)が、杭州城投産業基金や上城資本(Shangcheng Capital)などから総額10億元(約200億円)以上の戦略的投資を受けた。これは杭州の政府系ファンドが大規模AIモデル分野に初めて本格的に参入した事例であり、地元の有力企業DeepSeekよりも早い段階での投資となる。
Infinigence AI(無問芯穹)が、上海交通大学や清華大学と共同で開発した動画生成モデル推論IP「FlightVGM」が、FPGA 2025国際会議で最優秀論文賞を受賞した。中国本土の研究チームがこの賞を受賞するのは初めてで、アジア太平洋地域のチームにとっても画期的な成果となる。FlightVGMは、AMD V80 FPGA上でNVIDIA 3090 GPUを上回る性能とエネルギー効率を達成し、FPGAを活用した大規模モデル推論の可能性を示した。
テンセント(Tencent)は、AIシステムの潜在的なセキュリティリスクを検出するための軽量で使いやすいセキュリティ評価ツール「AI-Infra-Guard」を2025年2月26日にオープンソースで公開した。このツールは、28のAIフレームワークの指紋識別をサポートし、200以上のセキュリティ脆弱性データベースをカバーしている。ユーザーは、複雑な設定なしで即座にAIインフラのセキュリティ診断を実施できる。
DeepSeekは大規模AIモデルの推論システムを最適化し、日収56.2万ドル、利益率545%を達成した。V3/R1モデルは独自のExpert Parallelism(EP)技術を採用し、GPU負荷の最適化と通信のオーバーラップによる高速化を実現。さらに、夜間のAPI価格引き下げで利用促進を図る。AI推論コスト削減の新たな基準となり、業界に大きな影響を与える可能性がある。
2025年2月24日付の『鄭州日報』は、人工知能モデル「DeepSeek」の行政業務への統合について分析した記事を掲載した。記事では、DeepSeekを活用する際の課題や対応策として、目標の明確化、データセキュリティの確保、既存システムとの統合、職員の教育、継続的な改善の5つの視点を提示している。行政の効率化や意思決定の高度化を図る一方、データ管理の強化や技術の適応が求められると指摘されている。
百度(Baidu)は、最新の文心大模型(Ernie Bot)4.5を3月16日に正式リリースすると発表した。このモデルは、基礎能力の大幅な向上に加え、ネイティブなマルチモーダル対応や深層思考能力を備えている。また、6月30日からはオープンソース化を予定しており、AI技術の普及と革新をさらに推進する狙いがある。
上薬遼寧医貿は、ファーウェイ(Huawei)の昇騰(Ascend)AIサービスとDeepSeek大規模モデルを活用し、業務革新を進めている。業務チケット処理の自動化や契約書の事前審査の効率化に取り組み、AI技術を活用したデジタル化と全業務価値チェーンの最適化を目指している。
栄耀(Honor)とアリババ(Alibaba)はAI分野での協力を発表し、Qwen(千問)やWan(万相)などの言語、視覚理解、画像生成モデルを栄耀のYOYOスマートアシスタントに統合した。これにより、ユーザーはMagic7シリーズのスマートフォンなどで高度なAI機能を利用できる。
中国のリチウム電池大手である寧徳時代(CATL)は、百度(Baidu)と戦略的提携を結び、無人運転とデジタルインテリジェンスの分野で協力を開始した。これにより、CATLは電池製造だけでなく、AI分野への進出を図り、第七の新たな自動車産業モデルを構築しようとしている。
MiniMaxが開発した「万物追踪」は、生成AIを活用した情報提供アプリであり、ユーザーが関心を持つ特定の情報をインターネット上から継続的に収集し、カスタマイズされた内容をリアルタイムで提供することを目指していた。しかし、現在このアプリは主要なアプリストアから削除されており、サービスの継続性に不透明な部分が残されている。
百度(Baidu)と寧徳時代(CATL)が、福建省で戦略的提携を締結した。両社はデジタルトランスフォーメーションと自動運転の2分野で協力を強化する。BaiduはAI技術を活用してCATLのデジタル化を支援し、自動運転車の開発ではCATLの電池技術や交換システム、スケートボードシャーシ技術と連携して新たな商業モデルを模索する。
テンセント(Tencent)は新世代のAIモデル「混元(Hunyuan)Turbo S」を発表した。このモデルは、従来の「熟考型」モデルに対して「直感型」を採用し、瞬時に応答する「即時回答」を実現している。特に、知識、数学、創作などの分野で優れたパフォーマンスを示し、推論能力も大幅に向上。革新的な「Hybrid-Mamba-Transformer」アーキテクチャにより、コスト削減と効率向上も達成している。
DeepSeekは、並列処理の最適化を目的とした3つの新技術を公開した。双方向パイプライン並列アルゴリズム「DualPipe」、MoE向け負荷分散アルゴリズム「EPLB」、トレーニングと推論フレームワークのパフォーマンス分析データ「Profiling Data」で構成される。DualPipeは計算と通信を完全に重ね合わせ、EPLBはGPU間の負荷均等化を実現。GitHub公開後、瞬く間に開発者の注目を集めた。
阿里雲(Alibaba Cloud)は、2025年2月25日に動画生成大モデル「万相2.1 (Wan)」をオープンソース化した。14Bおよび1.3Bの2つのパラメーター仕様で、文から動画、画像から動画の生成が可能。最新技術を採用したモデルは、複雑な動きや物理シミュレーション、指令遵守能力で高い評価を受け、開発者はGithubやHuggingFace、ModelScopeで利用可能だ。
2月21日に開催されたStepFunのStep Upエコシステムオープンデイで、StepFun(階躍星辰)、Luckin Coffee(瑞幸咖啡)、Iluvatar CoreX(天数智芯)の三社が戦略的提携を発表。AIとスマートリテールを融合させ、技術開発から消費シーンまでの完全なサプライチェーンを構築。今後、専用大規模モデルの開発やAI応用の普及、エコシステムの共創を通じて、スマートな消費体験と持続可能な成長を目指す。
アリババのTongyi Labは2025年1月に、テキスト記述から高品質な2Dキャラクターを自動生成する新技術「Textoon」を発表。ユーザーの言語入力を解析し、Live2D形式でインタラクティブなキャラクターを1分以内に出力。外見編集やアニメーションにも対応し、2Dキャラクター制作の手間を大幅に削減する。
Qwenシリーズの最新モデル「QwQ-Max-Preview」が発表された。Qwen2.5-Maxを基盤とし、数学、コーディング、エージェント関連タスクなどで卓越した性能を発揮する。今後、さらなるアップデートやApache 2.0ライセンスでのオープンソース化が予定されている。
中国のニュースプラットフォーム「今日頭条」は、AI技術の進化による虚偽情報や低品質コンテンツの増加に対応するため、AIを活用したコンテンツ審査を強化中。2024年には500万件以上の虚偽情報や低品質AIコンテンツ、同質化投稿をブロックし、「AI対AI」のアプローチで情報の信頼性向上を目指す。
阿里巴巴(Alibaba)は、今後3年間で3800億元(約74兆円)を投資し、クラウドおよびAIハードウェアインフラの構築を強化する計画を発表した。この投資は過去10年間の投資額の合計を上回り、中国民間企業として最大規模となる。市場ではこのニュースを受け、Alibabaの株価が大幅に上昇している。
中国のAISphere(愛詩科技)が開発した「PixVerse V4」は、わずか5秒で高品質なAI動画を生成できる世界最速のツールだ。音声自動生成機能や人声配音機能を搭載し、文や画像から動画を作成可能。さらに、10種類以上のスタイル変換機能「リスタイル(Restyle)」や、動画物理演算の精度向上も実現し、企業ユーザーからも注目を集めている。
百度(Baidu)は2024年Q4および年間業績を発表し、総収益1331億元(約2兆7000億円)、純利益234億元(約4700億円)と21%の増益を達成。百度智能雲(Baidu AI Cloud)は山東港と戦略的提携を結び、AIと大規模AIモデル技術で港湾産業の革新を推進。また、百度(Baidu)のAIエージェント「客悦」は、沙利文の年間ランキングで三つの賞を受賞。新しいAI検索エンジン「DeepSeek-R1」フルスペック版の導入も話題となった。
LiblibAI(哩布哩布AI)は、設立から1年で4回目の資金調達を完了し、国内AIアプリケーション分野で最速の記録を更新した。最新の資金調達では、渶策資本(Ince Capital)、順為資本(Shunwei Capital)が主導し、明勢創投(Future Capital)など既存投資家が追加出資。資金はクリエイターエコシステム構築と技術開発に投資し、AI時代の創作基盤を強化する。
百度(Baidu)元幹部のEric Jing氏とKay Zhu氏が共同創立したAI検索エンジン「Genspark」が、シリーズAラウンドで1億ドルの資金調達を完了し、評価額は5億3,000万ドルに達した。Gensparkは、複数のAIエージェントが協働してユーザーのクエリに応答する「AIエージェントエンジン」として設計されており、月間アクティブユーザー数は200万人を突破している。
中国のAI企業「階躍星辰(StepStar)」が「Step UPエコシステム・オープンデー」で、AIエージェント技術をスマートフォン、スマートカー、IoT、ロボットなどに展開する新戦略を発表。新たに公開された多モーダルモデルと推論能力を駆使し、産業界での実装を加速する方針だ。特に自動車業界では、吉利自動車や千里科技と提携し、次世代の「AI+車」ソリューションを推進している。
無問芯穹(Infinigence AI)は、模速空間(Mosu Space)および上海儀電(Shanghai Instrument)と協力し、国内初の「算力エコシステムプラットフォーム」を発表した。このプラットフォームは、AI企業に「全周期、全要素、全プロセス」の一括サービスを提供し、計算能力、言語データ、アルゴリズム、シナリオを統合した閉ループエコシステムを構築する。上海市のAI産業高地化を推進し、世界最大のAIインキュベーターを目指す。
清華大学とカーネギーメロン大学が共同開発した「Crawl4LLM」は、AIの大規模言語モデル(LLM)向けに最適化されたオープンソースのクローラーシステムだ。従来のクローラーと比べ、5倍の効率で高品質なデータを収集可能。Crawl4LLMは、ウェブページの価値を評価し、AIモデルの事前学習に最も有用なデータを優先的に収集することで、計算資源の節約とデータ品質の向上を実現する。
中国の人気SNS「小紅書(RedNote)」が、AI検索アプリ「点点(Diǎn Diǎn)」にDeepSeek-R1モデルを導入する予定。点点は生活検索アシスタントとして、交通、美食、旅行、ショッピング、人間関係など多彩なシナリオに対応する。特に、TikTokの米国市場撤退を受け、小紅書(RedNote)の米国でのユーザー数が急増している。
中国のAIスタートアップ「DeepSeek」は、急速な需要増加に対応するため、設立以来初めて外部資金調達を検討していると報じられた。同社はAIチップやサーバーの確保に向け、阿里巴巴(Alibaba)グループや中国投資有限責任公司などの投資家と交渉中。また、研究中心の事業モデルから収益性を目指す方向への転換も議論されている。
Alibaba Groupは、2025年Q3財報でAlibaba Cloud(阿里雲)の売上が前年比13%増の317.42億元に達したと発表。特にAI関連収入は6四半期連続で三桁の成長を維持。最新のQwen2.5-Maxモデルを含む大規模なAIモデルの開発と、AIインフラの強化に注力しており、金融、エネルギー、交通、文化メディアなど多岐にわたる業界での利用が進んでいる。
字節跳動(ByteDance)が新たなAI動画生成ツール「Phantom」を公開した。Phantomは、人物や物品、動物、仮想キャラクターなど多様な主体の一貫性を保ちながら、自然で精度の高い動画生成を実現する。従来のAI動画生成ツールが抱える「主役の一貫性」問題を解決し、広告、映像制作、ゲームなど幅広い用途に対応可能だ。
階躍星辰(StepFun)と吉利汽車グループは、共同開発した2つのStepシリーズマルチモーダルAIモデル「Step-Video-T2V」と「Step-Audio」を全世界の開発者に向けてオープンソース化した。これにより、AI技術の共有と革新を促進し、人工知能の普及に貢献することを目指している。
北京中科慧霊機器人技術有限公司(霊宝CASBOT)は、シードラウンドで100億円超の資金調達を完了。資金は人型ロボット「CASBOT 01」の量産と技術開発に充てられる。ロボットは高度な運動制御と深層学習技術を備え、産業・商業・家庭向けに展開。NVIDIAとの協力で知能化を強化し、2025年には新型ロボットを発表予定。市場適応を進め、社会の生産性向上に貢献する。
2025年2月17日、百度(Baidu)は検索サービスと文心智能体平台(Ernie AgentBuilder)にDeepSeekと最新の文心(Ernie)大規模AIモデルの深層検索機能を導入すると発表した。ユーザーは無料で利用でき、開発者は文心智能体平台(Ernie AgentBuilder)上でDeepSeekモデルを活用し、インテリジェントエージェントの開発が可能となる。
DeepSeekチームは、コードを思考プロセスに変換する新たなデータセット「CODEI/O」を開発し、QwenやLlamaなどの大規模モデルをトレーニング。これにより、非コード分野を含む多様な推論タスクでモデル性能が向上した。さらに、実行フィードバックを活用した高品質データセット「CODEI/O++」を構築し、モデルの推論能力を一層強化した。
TencentとBaiduがDeepSeekモデルを自社の検索機能に導入し、中国の検索市場に大きな変化が訪れている。一方、ByteDanceは技術革新の遅れを反省し、大規模AIモデルを開発する「大規模AIモデル六虎」の企業は、それぞれ異なる戦略を取り始めている。DeepSeekの急速な普及により、業界全体の競争環境が大きく変化し、中国のAI市場は新たな段階に突入した。
百度(Baidu)は「文心(Ernie)」大規模モデルの最新バージョン4.5を数カ月以内に順次リリースし、6月30日から正式にオープンソース化すると発表した。さらに、4月1日から「文心一言(Ernie Bot)」の無料化と「深度検索」機能の提供を開始する。百度CEOである李彦宏氏は、AI基盤施設への継続投資を強調し、推論コストの大幅削減を目指す。年内には「文心(Ernie)」5.0のリリースも予定されている。
2025年2月13日、北京児童医院は国内初の「AI小児科医」を導入し、多学科診療に参加させた。このAIは百川智能の大規模AIモデル「Baichuan M1」を基盤に開発され、13名の専門医と共に8歳男児の難病症例を診断。AIの診断結果は専門医と高い一致を示し、臨床推論能力の高さを証明した。今後、医療資源の均衡化と診療効率の向上に貢献すると期待される。
AI技術開発企業の無問芯穹(Infinigence AI)と中国大手IT企業の聯想(Lenovo)が協業し、次世代のAI PCを含むインテリジェント端末の開発を推進する。両社は「エッジモデル+エッジソフトウェア+エッジIP」一体化ソリューションを構築し、個別最適化されたエッジAIの新たな形を探る。また、無問芯穹はAIモデルの計算能力を最適化するInfini-AI異構クラウドプラットフォームを提供し、AI技術の普及とAGI(汎用人工知能)の実現を加速させる。
2025年2月14日、中国のAI企業・昆侖万維(Kunlun Tech)が新たな空間知能技術「Matrix-Zeroモデル」を発表した。これは、3D空間生成とインタラクティブ動画生成を統合し、デジタルコンテンツ制作を革新するもの。従来の3D生成ツールよりも広範な探索が可能で、リアルな物理シミュレーションにも対応。映画、ゲーム、具身知能分野での活用が期待される。Matrix-Zeroは4月に正式リリース予定。
百度(Baidu)は、AIモデル「文心大模型(Ernie AI Model)」の進化とコスト削減に伴い、チャットボット「文心一言(Ernie Bot)」を4月1日から完全無料化すると発表した。これにより、全てのPCおよびアプリユーザーが最新のモデルや超長文処理、専門的な検索強化、高度なAI描画、多言語対話などの機能を利用できるようになる。さらに、同社は今年後半に次世代AIモデル「Ernie 5.0」をリリースし、マルチモーダル能力の大幅な強化を予定している。
DeepSeekの大規模AIモデルが限られた算力で高性能を実現し、国産AIの可能性を示した。無問芯穹(Infinigence AI)のCEO夏立雪は、ソフトとハードの協調最適化が鍵となると指摘。中国がAIのエコシステムを自立させるためには、①既存ハードの最適化、②異種AIシステムの構築、③国産チップを活用した同質AIシステムの確立が必要だ。今後の大規模モデル競争は、システム全体の能力が問われる。
TencentのAIワークスペース「ima.copilot(ima)」が、新たにDeepSeek-R1モデルを導入した。ユーザーは検索、読解、執筆、ナレッジベース機能において、Tencentの混元大モデルまたはDeepSeek-R1を選択可能。imaはWindows、Mac、WeChatミニプログラムで利用でき、情報処理を効率化。さらに、DeepSeekは数学推論やローカル推論の最適化に成功し、低スペックの環境でも動作可能となった。
阿里巴巴(Alibaba)の通義実験室(Tongyi Lab)は、2025年2月10日に「Animate Anyone 2」を発表した。この技術は、静止画像を基に動画内の人物と自然に置き換えるAIモデルで、環境との統合や物体との相互作用を強化し、よりリアルな動きを実現する。競合技術Viggleと比較して、動作の滑らかさとリアルさが向上している。現在は商用化されていないが、映像制作やコンテンツ創作の分野での活用が期待される。
中国国務院国有資産監督管理委員会(国資委)は、国家级データ統合を担う「国家数据集团(国家データグループ)」の設立を準備している。これは、データ市場化改革の深化を目的とし、エネルギー、金融、医療、工業などの分野のデータ資源を統合・最適化する。AIやブロックチェーン技術を活用し、安全なデータ流通を確保しながら、データの商業化と国際競争力向上を目指す。
アップルは、中国のiPhoneユーザー向けのAI機能開発において、アリババと提携を進めている。アリババの豊富なユーザーデータと強力なAIモデルが、アップルのニーズに適合すると判断されたためである。この協力により、アップルは中国市場での個別化サービスの強化を目指している。
小紅書と上海交通大学は、多モーダル大規模モデル(MLLMs)の実世界理解能力を評価する新基準「WorldSense」を発表した。視覚、音声、テキストを統合的に処理するAIの性能を測るこの基準は、1,662本の視聴覚同期動画と3,172の質問から構成される。評価の結果、最新のMLLMsでも正答率は25%〜48%にとどまり、AIの実世界理解能力には依然として大きな課題があることが明らかになった。
中国の著名映画監督・陸川が、Viduや今日AI芸術センターと共同で「幻想の門」AI短編映画募集プロジェクトを発表した。本企画は、AI技術を活用した1~2分の短編作品を募集し、現実と幻想の交錯する世界を表現することを目的としている。入賞者には、ノートPCやViduのプロフェッショナルプランなどの賞品が贈られ、さらにAI短編映画集の開発計画にも参加可能となる。
阿里巴巴(Alibaba)のAIプログラミング支援ツール「通義霊碼(Tongyi Lingma)」が、DeepSeek-V3およびDeepSeek-R1モデルのサポートを開始した。これにより、開発者は自身のニーズに応じてモデルを選択し、複雑なコーディングタスクを効率的に遂行できる。今後もさらなるモデルの追加が予定されており、ユーザーにより個別化されたサービスが提供される見込みだ。
無問芯穹の異構クラウド大モデルサービスプラットフォームが、DeepSeek-R1の国産チップ7種への適応を完了。壁仞、海光、摩尔线程、沐曦、昇騰、燧原、天数智芯などのハードウェアで最適化されたAI推論を実現し、開発者はInfini-AIプラットフォームを通じて簡単にアクセス可能に。国産算力の普及とAIエコシステムの構築を加速させる一歩となる。
2025年2月11日、UAEドバイで開催されたWorld Governments Summit 2025で、百度創業者の李彦宏氏は、AI基盤への継続的な投資の重要性を強調。大規模モデルの推論コストは年90%以上低下し、技術進化が加速していると指摘。また、自動運転技術は人間の運転より10倍安全であり、中国市場におけるコスト削減と技術革新の重要性についても言及した。
2025年1月20日~24日、スイス・ダボスで開催された世界経済フォーラム(ダボス会議)に、清華大学智能産業研究院(AIR)院長の張亜勤氏が登壇。AIの国際協力、生成AIのリスク管理、自動運転技術の発展について議論した。特に自動運転分野では、安全性向上や商業化の課題、大規模AIモデルとの統合を強調し、2030年までにL4レベルの自動運転車が普及する可能性を示唆した。
商湯科技(SenseTime)は、企業や開発者向けに「商湯大装置」プラットフォームでDeepSeek-V3やDeepSeek-R1の提供を開始した。利用者は3ヶ月間1000万トークンを無料で利用可能。さらに、業界特化型の軽量モデルのカスタマイズや、異種ハードウェア対応の効率的な推論環境を提供する。商湯大装置は、多業界のビジネス効率化を支援し、今後も技術・サービスの強化を続ける。
中国のVCがAI企業DeepSeekへの投資機会を逃したことが話題になっている。DeepSeekは資金調達を必要とせず、独自の成長戦略を取っており、VCの介入を拒否してきた。一方、阿里巴巴の10億ドル投資の噂が市場を揺るがしたが、最終的に否定された。さらに、以前「大規模AIには投資しない」としていた投資家朱啸虎が一転、DeepSeekの可能性を強く評価し、投資意欲を示した。
2025年2月8日、昆侖万維のAIプラットフォーム「天工AI」がPC版の大幅アップデートを発表。新機能「DeepSeek R1 + ネット検索」により、これまで不安定だったDeepSeekのオンライン検索が安定化し、リアルタイム情報の取得が可能に。特に学術研究や金融分析において、膨大なデータを活用できる高度な検索機能が強化され、AIの推論能力と実用性が向上した。
中国のAI業界では、DeepSeekに続き、Stepfun、ModelBest、Zhipu、Infinigence AIが台頭している。Stepfunは大規模言語モデルを開発し、AGI研究を推進。ModelBestは小型言語モデルを提供し、低コストで高効率な処理を実現。Zhipuは対話型AIや動画生成技術を展開し、米国の輸出規制の影響を受ける。Infinigence AIは異種チップを活用し、AI計算インフラを最適化している。
2月2日、清華・上海交通・復旦大学の教授らがDeepSeekの技術原理と最適化手法について議論した。特に、DeepSeekがCUDAの壁を突破したか否かが焦点となった。PTX(並列スレッド実行)の最適化により、ハードウェア性能の最大化を図ったが、「CUDAを完全に回避した」との解釈には異論もある。国内AIの今後の発展と、ソフトウェアとハードウェアの協調最適化の重要性が強調された。