中国の3D技術企業VASTは、主力技術「Tripo」のオープンソース化を正式発表。画像からの3D自動生成、高精度メッシュ処理、リアルタイムレンダリングなど、エンタープライズ向け機能を個人開発者に無償提供。インディーズゲーム開発者やアーティストの創作活動を支援し、3Dコンテンツ制作の民主化を推進する。
中国SNS大手のXiaohongshu(小紅書)がAI創作プラットフォーム「画薪」を正式公開。画像生成、動画編集、文章作成を統合し、SNSコンテンツ制作に特化。月額29.9元の低価格設定で、個人クリエイターの創作活動を支援。プラットフォーム内での直接投稿機能も実装。
北京智源研究院(BAAI)が開発した「Aquila-VL 2.0」は、視覚と言語を統合理解する次世代マルチモーダルAI。34Bパラメータで、画像理解、文書解析、ビデオ要約などでGPT-4Vの95%の性能を達成。オープンソースで公開され、研究用途は無償利用可能。
清華大学が開発した「EmoLLM」は、人間の感情を理解し共感する能力を持つ世界初のLLM。テキストから感情を認識し、適切な感情的応答を生成。メンタルヘルスケアやカウンセリング分野での活用が期待される。オープンソースで公開予定。
ByteDance傘下のDouyin(抖音)が、AI動画編集ツール「即夢」を全ユーザーに無料開放。自動カット編集、BGM生成、エフェクト追加を一括処理し、プロ級の短編動画を数分で制作可能。日間アクティブユーザー7億人への展開で、動画制作の大衆化を推進。
商湯科技傘下のSenseVideoが産業用動画解析AI「工業之眼3.0」を発表。製造ラインの異常検知精度99.8%を達成し、事故予防と品質管理を大幅改善。リアルタイム処理で即座にアラート発信、ダウンタイムを60%削減。
ByteDanceの企業向けAIプラットフォーム「火山方舟3.0」が大幅アップグレード。完全オンプレミス展開に対応し、企業の機密データを外部に一切送信しない設計を実現。50以上の業界別テンプレートを用意し、導入から運用まで平均2週間に短縮。
雲知声が医療特化型音声AI「UniMed Voice 3.0」を発表。30以上の中国方言に対応し、医療専門用語の認識精度98.5%を達成。電子カルテの音声入力で医師の作業時間を70%削減。全国3,000病院での導入を目指す。
哈爾浜工業大学とアリババが共同開発した「天穹」AIは、宇宙大規模構造のシミュレーションと暗黒物質分布の予測に特化。従来の計算手法より1000倍高速で、宇宙論研究に革新をもたらす。中国の天文学研究における AI活用の先駆例。
網易有道が次世代教育AI「有道小P 3.0」を発表。生徒の学習パターンをリアルタイム分析し、個別最適化された学習計画を自動生成。宿題の自動添削や弱点補強問題の出題も可能。K-12教育市場での普及を目指す。
中国最大の漫画プラットフォーム快看が、AI漫画制作ツール「快看AI」を正式リリース。テキストプロットから自動でコマ割り、キャラクター生成、背景描画を実行。制作時間を90%削減し、個人創作者の参入障壁を大幅に下げる。
広汽集団が自動車デザイン専用AI「GAC Design AI」を開発。スケッチから3Dモデル、空力解析、製造可能性検証まで統合処理。デザイン期間を6ヶ月から2ヶ月に短縮し、開発コストを40%削減。
Bilibiliが仮想アイドル生成AI「B-Idol」を発表。音声合成、モーション生成、表情制御を統合し、リアルタイムでバーチャルライブが可能。ユーザーがオリジナルVTuberを簡単に作成でき、収益化プログラムも提供。
上海人工智能研究院が次世代都市管理AI「城市大脳4.0」を発表。交通流最適化、大気質予測、エネルギー管理、緊急対応を一元化。上海市全域のIoTセンサーと連携し、都市運営効率を35%向上。スマートシティの新標準を確立。
順豊速運の技術部門が物流AI「豊脳2.0」を発表。気象、交通、イベントデータを統合分析し、配送時間を95%の精度で予測。最適ルート自動計算で配送効率を30%向上、燃料コストを20%削減。
動画配信大手の愛奇芸がコンテンツ制作AI「奇創」を発表。脚本生成、絵コンテ作成、プリビズ制作、音楽生成を統合。制作期間を70%短縮し、小規模制作会社でも高品質コンテンツ制作が可能に。
DJIが災害対応特化型ドローンAI「天空之眼」を開発。被災地の3Dマッピング、生存者の自動検出、最適救助ルート計画を実現。5G通信と連携し、リアルタイムで指揮センターと情報共有。中国の災害対応能力を大幅強化。
LiblibAIが動画1本から3Dアバターを自動生成する「LibAvatar」を公開。モーションキャプチャ不要で、表情や動きを高精度で再現。生成時間は10分以内、商用利用も可能。VTuber市場への参入障壁を大幅に引き下げる。
BYDが電気自動車向けバッテリー管理AI「電池医生」を開発。個々のセルの劣化状態をリアルタイム監視し、寿命を98%の精度で予測。異常検知で発火リスクを99%削減。全車種への標準搭載を2025年内に開始。
復旦大学の研究チームが開発した「ProteinGPT」は、目的に応じた新規タンパク質を自動設計するAI。既存薬の1000倍の効果を持つ候補物質の発見に成功。製薬業界との共同研究で、アルツハイマー病治療薬の開発が進行中。
中国の半導体企業・寒武紀が最新AI推論チップ「思元590」を発表。7nmプロセスで製造され、推論性能でNVIDIA H100の80%を達成しながら、消費電力は半分に抑制。価格も大幅に安く、国産代替の本命として期待が高まる。
滴滴出行の自動運転部門が、深圳市で完全無人運転タクシーの商用サービスを開始。安全運転手なしでの営業運行は中国初。2025年末までに1日1万台の運行を目指し、料金は通常タクシーの70%に設定。
達観数据が企業知識管理AI「智庫3.0」を発表。散在する社内文書を自動で収集・構造化し、知識グラフを構築。自然言語での質問に即座に回答し、業務効率を40%向上。大手企業500社での導入が決定。
liblibが開発したデザインAIエージェント「Lovart」は、複数の生成AIと実務ツールを統合し、プロンプト一文で画像・動画・音楽の生成から編集まで一貫して対応する。Claude 3.7ベースの思考エンジンを備え、GPT-4oやImagen 3、Tripo AI、Suno、Kling AIなどを統合活用し、高度なデザイン出力が可能。
華大基因がゲノム解析専用AI「GenomeGPT」を開発。全ゲノムシーケンスデータを10分で解析し、疾患リスクを予測。希少疾患の診断精度93%を達成。個別化医療の実現に向けて、全国1000病院での展開を計画。
StepFunは、高精度かつ制御可能な3D資産を生成する新フレームワーク「Step1X-3D」を公開した。本システムは、画像1枚から高品質な3Dメッシュとテクスチャを生成でき、生成精度と制御性を両立する2段階構成のアーキテクチャを採用している。
アリババ傘下のAI研究機関Tongyi Labが開発したVACE(Video Atomic Composable Editing)は、動画生成と編集機能を一体化したAIモデルであり、Wan(通義万相)シリーズの一環としてオープンソース公開された。480Pおよび720Pの解像度に対応し、文、画像、動画、マスク、ポーズや光流などの制御信号を統合的に扱う。
Vue3、Typescript、Three.js、Element Plusを基盤としたWebベースの3Dモデル可視化エディタ「Three.js3D」が、3日間でGitee上のスター数1,000件を突破し注目を集めている。本プロジェクトは完全オープンソースでMITライセンスのもと提供されており、商用利用や改変も可能。
バイトダンスは、テキストと画像を統一形式で処理可能なマルチモーダル生成AIフレームワーク「FlowTok」を発表し、コードとデモを公開した。FlowTokは、従来のようにテキストを条件信号として拡散処理するのではなく、テキストと画像の両モダリティを同じ1次元トークン形式にマッピングし、直接変換を行う点が最大の特徴である。
バイトダンスのSeedチームは、次世代ベクトルモデル「Seed1.5-Embedding」の技術仕様を発表した。Doubao-1.5-proを基盤に構築された本モデルは、検索・分類・クラスタリングといった自然言語理解タスクに特化しており、MTEBとBRIGHT両ベンチマークにおいて英中ともにSOTA(State-of-the-Art)を記録した。
バイトダンスが展開したAIマーケティングツール「Pippit」は、プロダクト紹介サイト「Product Hunt」の週間ランキングで1位を獲得し、大きな注目を集めた。Pippitは動画編集ツール「CapCut」の派生プロダクトとして誕生し、元は越境EC向けの「Commerce Pro by CapCut」だった。
バイトダンスのAI研究部門「Seed」チームは、コード生成に特化した大規模言語モデル「Seed-Coder」を初めてオープンソースとして公開した。モデルはLLaMA 3ベースで、約8.2Bのパラメータを持ち、コード生成分野においてQwen3を上回る性能を発揮。Base、Instruct、Reasoningの3種のモデルバリエーションが提供されており、すべてMITライセンスのもとGitHubおよびHugging Face上にて公開されている。
米国政府によるAI半導体輸出規制の強化を受け、NVIDIAは主力製品「H20」チップの中国向け性能削減版を7月に投入する方針を固めた。H20は当初、中国市場で販売可能な中で最も高性能なAIチップとして位置づけられていたが、米商務省が突如、同チップの輸出に新たな許可申請を要求。事実上の禁輸対象に変更されたことで、NVIDIAは緊急対応を迫られた。
Kuaishou(快手)のKling(可霊)研究チームは、3D空間における被写体とカメラの動きを自由に制御できる動画生成フレームワーク「CineMaster」を発表した。このシステムはユーザーが監督のように演出を設計できるインタラクティブ性を備え、SIGGRAPH 2025に論文が採択されている。
Maitrixチームが開発した「Voila」は、リアルタイムで音声を聞きながら即座に応答できる"同時対話型"のAI音声モデル。195msという低遅延は人間の反応時間よりも早く、まるで人と話しているかのような自然な会話が可能となる。
ファーウェイのPanGu(盤古)チームは、中国国産のAscend NPUを6000枚以上使用した大規模クラスタ上で、7180億パラメータのMoE(Mixture of Experts)モデル「PanGu Ultra MoE」の安定訓練に成功した。これは従来、NVIDIA製GPUに依存してきた大規模モデル訓練において、完全な自立を象徴するブレークスルーとなる。
Appleが中国市場向けに展開するiPhoneのAI機能において、技術提供先の内訳が明らかになった。複数の関係者によると、AI機能の技術構成比はアリババが65%、バイドゥが35%。契約金額は年間100億元(約2,100億円)を超えるとされ、バイドゥはクラウド検索、画像・視覚認識、音声起動機能を担当し、それ以外のAI能力はアリババが提供している。
テンセントが提供する3D生成ツール「Hunyuan(混元)3D V2.5」が、中国国内外で大きな注目を集めている。1枚の人物画像やテキスト指示だけで、3Dキャラクターやプロダクトモデルを自動生成できる本ツールは、現在無料で利用でき、1日20回まで生成が可能だ。
中国・広州発のウィーライド(文遠知行)は、自社のL4自動運転技術を軸にRobotaxiを世界展開中。UAE、スイス、フランス、スペインなど10カ国30都市に進出し、Uberとの連携を通じたサービス展開も進む。アブダビやドバイでの稼働に続き、今後5年間で15都市への展開が予定されている。
アリババ傘下のTongyi Labで人物動画生成技術を率いていた薄列峰(Bo Liefeng)が、4月30日付で同社を離職した。移籍先は米国拠点の大手インターネット企業で、マルチモーダルAI部門のVP(Vice President)に就任したとされる。このポジションは、同社の組織再編後に新設されたとみられ、競業避止義務への対応策としても注目されている。