CAMEL-AIが「エージェント環境拡張プロジェクト」を始動──RLエージェント環境の共創を呼びかけ

CAMEL-AIは強化学習エージェントの“最後の一マイル”問題を解決すべく、共通環境を構築するオープンプロジェクトを開始。LoongやOASISなど既存基盤を活かし、7分野で環境整備を推進。開発者に広く参加を呼びかけている。

Vision Intelligence、AI通訳イヤホン「iFLYBUDS」で急成長──3ヶ月で2度の資金調達を実施

Vision Intelligence(未来智能)がAI通訳イヤホン「iFLYBUDS」を軸に3ヶ月で2度の資金調達を達成。自社開発AIと実用重視の製品戦略により、グローバル展開と多モーダル端末への進化を加速している。

Vidu Q1、動画生成ベンチマークで世界1位に──SoraやRunwayを上回る性能を記録

中国発の動画生成AI「Vidu Q1」が、VBenchおよびSuperCLUEにて世界1位を獲得。RunwayやSoraを凌駕し、画像生成動画部門でも高評価を受けた。Web・モバイル両方で利用可能。

中国AIスタートアップSand.AIが開発、動画生成AI「Magi-1」公開──完全オープンソースでSora超えと話題に

中国のAIスタートアップSand.AIが、動画生成モデル「Magi-1」を発表。Diffusion Transformerベースの自回帰構造で無限長の動画生成や秒単位の制御が可能。物理整合性や因果性も高精度に実現し、全コードと技術文書を完全公開。Soraを超えるとの声も。

Tripo Doodle(TripoSG Scribble)公開──VASTがリアルタイム3D生成ツールをオープンソース化

VASTが新ツール「Tripo Doodle」をオープンソースで公開。スケッチとテキストをもとにリアルタイムで3Dモデルを生成できる直感的なツールで、SIGGRAPH Asia 2024で話題を集めた。生成AIによる3D制作の民主化を加速する。

アリババと北京郵電大学、Wan2.1ベースの音声駆動デジタルヒューマン「FantasyTalking」発表──静止画像から自然な会話アニメ生成

アリババ、高徳地図、北京郵電大学が共同開発した「FantasyTalking」は、Wan2.1を活用した音声駆動型デジタルヒューマン生成技術。画像・音声・テキストを入力するだけで、個人の特徴を保ったリアルな会話アニメを自動生成する。

TripoSG:スケッチ+プロンプトにも対応、TripoAIの高精度3D生成モデルが進化

TripoAIが開発したTripoSGは、画像・テキスト・スケッチなど多様な入力から高精細な3Dモデルを生成できるオープンソースAI。新たに「TripoSG-scribble」も登場し、スケッチとプロンプトからの高速3Dプロトタイピングが可能になった。

Spark X1(星火X1)が大幅アップグレード──中国国産インフラで高精度を実現、API無料開放とカスタム対応も強化

iFLYTEKが開発するSpark X1(星火X1)が進化。OpenAI o1やDeepSeek R1に匹敵する精度を中国国産インフラで実現。API無料開放、簡易なカスタムチューニング機能も提供し、導入・応用がより身近に。

SkyReels-V2公開──Kunlun Techが長時間映像生成の限界を突破、全モデルをオープンソース化

Kunlun Techが開発したSkyReels-V2は、Diffusion-forcingとマルチモーダルLLMを融合し、映画レベルの長時間映像を生成可能に。関連技術も含め完全オープンソース化を実現。

Yuanjing(元境)、3D AIGCと空間認識技術で観光・文化産業の革新を推進──上海市メタバース成果展で最新事例を発表

Yuanjing(元境)は上海市メタバース成果展にて、3D AIGCと空間認識技術を活用した観光・文化産業向けソリューションを発表。リアルと仮想の融合により没入型体験を実現し、デジタルコンテンツの生産性と商業価値の向上を図る。

「Tripo」3D生成AI、精度で話題沸騰 ゲーム・映像制作向け多機能を搭載

シリコンバレー発のTripoは、テキストや画像から高精度な3Dモデルを生成できるAIツール。豊富な編集機能と既存ツールとの連携で、ゲームや映像制作の実務にも対応。生成品質とワークフローの柔軟性で注目を集めている。

バイトダンス、「思考する操作エージェント」UI-TARS-1.5を公開──複雑GUIやゲーム操作で最高性能達成

バイトダンスは、視覚と操作の連携で実行力を高めた「思考型ユーザー操作エージェント」UI-TARS-1.5をオープンソースで公開。GUI操作やMinecraft環境において前例のない性能を示し、強化学習と推論による進化型モデルとして次世代の汎用AIの可能性を示した。

ファーウェイ、家庭用SUV「問界M8」を発表──ADS 4.0とトリプルセーフティ設計で1時間2万台を受注

ファーウェイは最新SUV「問界M8」を発表し、発売1時間で2万台を受注。ADS 4.0による「駐車場から駐車場まで」の自動運転、安全面でのトリプルセーフティ設計、家庭空間を再現する車内装備などが話題に。価格は36万元(約750万円)から。

アリババのTongyi Lab、冒頭とラストの画像から自然な動画を生成する「Wan2.1」モデルをオープンソース公開

アリババのTongyi Labが開発した動画生成モデル「Wan2.1」を公開。2枚の画像から自然な映像を生成できる高精度モデルで、推論速度とコスト効率にも優れる。GitHubやHugging Faceで入手可能。

X-ORIGIN-AI、感情的な人間・機械インタラクションを核に約1億元(約21億円)のPre-A資金調達

AIハードウェア企業X-ORIGIN-AI(玄源科技)が、感情的な人間・機械インタラクションを核とした個性化AIロボット開発で約1億元(約21億円)を調達。AGI時代に向けたマルチモーダル感情認識技術と動的記憶システムで「温もりある知能」を実現。

復旦大学とバイトダンス、画像生成AI「SimpleAR」を発表──推論速度14秒、拡散モデル超えの性能

復旦大学とバイトダンスが共同開発した自回帰型画像生成AI「SimpleAR」が公開された。0.5BパラメータでGenEvalスコア0.59を記録し、従来の拡散モデルを超える性能と推論速度14秒を両立。次世代画像生成の有力候補として注目される。

バイトダンスの推論モデル「Seed-Thinking-v1.5」技術詳細公開、200Bパラメータでコスト半減

バイトダンスのSeedチームが、次世代推論モデル「Seed-Thinking-v1.5」の技術詳細を公開。数学やプログラミングなど専門タスクで業界最先端水準を達成しつつ、推論コストはDeepSeek R1比で50%削減。4月17日からVolcano Engine(火山引擎)で体験可能。

アリババのAI戦略が明らかに:未発表のまま実行フェーズへ突入

アリババはAGIの実現を最重要目標に据え、3年間で3800億元(約7.8兆円)をAI・クラウド基盤に投資する計画を進行中。Qwenのオープンソース戦略やToCアプリの強化により、商用AI時代の再起を目指している。戦略は未公表だが、既に実行段階に突入している。

MiniMax、マルチモーダル生成API「MCP Server」を正式リリース、コードもオープンソース化

MiniMaxがマルチモーダル生成機能を統合した「MCP Server」をリリース。テキスト入力のみで動画、画像、音声、音声クローンなどを一括生成可能。CursorやClaude Desktopなど複数のMCPクライアントに対応し、GitHubでコードをオープンソース公開済み。

アリババの「Bailian(百錬)」、業界初のMCPフルライフサイクルサービスを開始──ノーコード・5分で企業向けAI Agent構築

アリババクラウドの「Bailian(百錬)」プラットフォームが、業界初のフルライフサイクルMCP(Model-Callable Protocol)サービスを公開。開発者は0行のコードと5分の操作で企業レベルのAI Agentを構築可能。標準化プロトコルによりツール接続の効率も飛躍的に向上した。

SenseTime(商湯科技)が「日日新 SenseNova V6」発表、マルチモーダル推論で日常生活にAIを浸透

SenseTime(商湯科技)が新たに発表した大規模モデル「日日新 SenseNova V6」は、マルチモーダル長期推論と全体記憶機構を活用し、画像・音声・映像を横断した複雑な理解と推論を実現。保険処理や動画編集、音読翻訳など日常生活や業務にAIが実用レベルで融合。高性能ながらコストは国内最低水準で、GPT-4やGemini 2.0 Proと同等以上の能力を持つ。

バイトダンスが新推理モデルSeed-Thinking-v1.5を公開、GitHubで評価データも同時提供

バイトダンスは推論特化型の大規模AIモデルSeed-Thinking-v1.5を発表し、GitHubで評価用データセットとベンチマーク結果を同時公開。数学・コード・科学分野でDeepSeek R1を上回る性能を実現し、創作分野でも高いユーザー評価を得た。

中国製CPUの進化と挑戦──「自立性と制御性」を実現するための最適解とは?

中国は技術自立を国家戦略とし、CPUを含むコンピューティング能力の国産化を推進。x86互換のC86体系を核に、実用性・制御性・安全性を兼ね備えたCPUが次世代のIT国産化産業を牽引。Hygon(海光)などが進めるオープンかつ自律的な発展モデルに注目が集まる。

香港大学とAdobe、VAE不要の「PixelFlow」発表:ピクセル空間での段階的画像生成が新時代を拓く

香港大学とAdobeの研究チームが、変分オートエンコーダ(VAE)を使わず、ピクセル空間で直接画像を生成する新手法「PixelFlow」を開発。段階的に解像度を高める設計とFlow Matchingにより、高画質・高効率な生成を実現。ImageNetベンチマークで最先端モデルを超える性能を示した。

Black Sesame Technologies(黒芝麻智能)が初の黒字化、公表利益は31億元(約650億円)も実態は赤字継続——中国自動運転チップ業界の実態とは

自動運転チップ企業「Black Sesame Technologies(黒芝麻智能)」が2024年に黒字化を達成と発表、純利益は3.13億元(約65億円)に上る。しかしその実態は、会計上の評価益による見せかけの黒字で、営業損失は依然として大きく、実質的には13億元(約270億円)の赤字。業界全体では国産チップのシェア拡大が進み、NVIDIA一強時代に変化の兆しが見え始めている。

アリババのTongyi Lab、1枚の写真から数秒で動く3Dデジタル人間を生成する「LHM」と「LAM」を公開

アリババのTongyi Labが開発した「LHM」と「LAM」は、写真1枚からインタラクティブな3Dデジタル人間を数秒で生成するオープンソースAI。LHMはモーション対応3D人体を、LAMは会話可能な3Dアバターを出力。ゲーム、VR、バーチャル接客などに応用可能。

蔡浩宇率いる新AIゲーム『Whispers From The Star』実機デモ公開、ステラとの対話が物語を動かす

miHoYo創業者・蔡浩宇が率いるAnuttaconが開発中のAIゲーム『Whispers From The Star』の実機映像が公開された。プレイヤーの音声や発言によってヒロイン「ステラ(Stella)」の運命がリアルタイムに変化する設計で、従来のゲームとは異なる没入型の体験を提供する。

Li Auto(理想汽車)、車載向け「DeepSeek」自社開発 個人の嗜好を汲み取る“深度思考AI”を搭載

Li Auto(理想汽車)は、人気AIモデル「DeepSeek」を車載向けに最適化した自社開発の推理モデルを発表。ユーザーの発話内容から思考の必要性と深さを自律的に判断し、旅行計画や投資助言、家族対応まで高速かつ柔軟に応答する機能を備える。

バイドゥAIが「テック界のオスカー」エジソン賞で金銀受賞、無人運転と野生動物保護で世界に貢献

バイドゥのAIプロジェクトが、2025年のエジソン賞で金賞と銀賞を受賞。無人運転サービス「Apollo Go」は中国初の金賞に輝き、野生動物保護ツール「絶滅危惧種AI守護官2.0」は持続可能性分野で銀賞を獲得。両者とも国際的な評価を得た。

2025年3月のAIアプリランキング発表、中国勢が世界トップ10の半数を占める

2025年3月のAIアプリランキングが発表され、夸克(Quark)、豆包(Doubao)、DeepSeek、元宝(Yuanbao)、Talkieが世界トップ10入り。中国国内市場ではアリババ、バイトダンス、テンセントが主導権争いを繰り広げている。

Project OASIS:中国発、100万AIユーザーで構成された「仮想社会」シミュレーション環境が進化中

中国のCAMELチームが開発したOASISは、最大100万体のAIエージェントがソーシャルメディア上で相互作用するシミュレーション環境。最近のアップデートで推論速度が13倍に高速化され、OpenAIのEmbeddingモデルを活用した推薦システムも導入された。

太陽フレアから地球を守る──国家天文台とアリババが世界初の太陽特化型AIモデル「金烏」を公開

中国国家天文台とアリババクラウドが、世界初の太陽フレア予測に特化した大規模AIモデル「金烏」を共同発表。従来の手作業では困難だった膨大な観測データを処理し、M5クラスのフレアで91%超の予測精度を実現。宇宙空間の安全保障にAIが新たな力をもたらす。

バイドゥの深層学習フレームワーク「PaddlePaddle(飛槳)」3.0正式リリース、産業応用と大規模モデル時代を全面支援

バイドゥの深層学習フレームワーク「PaddlePaddle(飛槳)」が3.0正式版を公開。自動並列化や大規模モデル対応、高次自動微分、神経ネットワークコンパイラ、多種チップへの適応性を強化し、AIの産業化と科学研究の両面で開発者を支援する。

アントグループ×清華、200ドルで最強推理AIを再現可能に──AReaL-bobaがRL訓練を民主化

アントグループと清華大学が共同開発したRL訓練フレームワーク「AReaL-boba」が公開された。わずか200ドル・200件のデータでSOTA級の数学推理AI「QwQ-32B」を再現可能で、コードやデータも完全公開されている。中小規模チームでも短期間で高性能モデルを構築できる新たな訓練パラダイムとして注目を集めている。

UniTreeがアントグループとチャイナモバイルから戦略投資、評価額は約80億元(約1,600億円)のまま維持

人型ロボット開発で注目されるUniTree(宇樹科技)が、アントグループとチャイナモバイル(中国移動)から戦略投資を受ける見込みとなった。評価額は前回と同水準の約80億元(約1,600億円)。四足ロボットで世界的なシェアを持つ同社には今後、政府・企業向けの商用展開が期待される。一方で、業界全体の投資過熱に対する懸念も強まっている。

アーカイブ

March /2025

February /2025

January /2025

December /2024