清華大学とByteDance、動画生成AI「CamCo」を発表──カメラ制御可能な高精度モデル

清華大学とByteDanceが共同開発した「CamCo」は、プロンプトでカメラ動作を精密制御できる動画生成AI。わずか2秒の計算で4秒動画を生成し、商用利用可能なCC-BY-4.0ライセンスで公開。

MiniMax、ゲーム向け音声クローンサービス「Voice Conversion」を公開──リアルタイム変換で新体験を創出

MiniMaxが新サービス「Voice Conversion」を発表。わずか10秒の音声サンプルでリアルタイム音声変換が可能に。ゲーム、動画制作、SNSでの活用を想定し、プライバシー保護機能も搭載。

「DeepSeekプロンプトハンドブック」清華大学版を無料公開──体系的アプローチで全100ページ

清華大学がDeepSeek活用に特化した100ページのプロンプトエンジニアリング教材を無償公開。基礎から高度な技術まで体系的に解説し、多分野での実践例を収録。学術界からの信頼性の高い指南書として注目。

アリババ、Qwen3シリーズをオープンソース化──32Bモデル登場、長文/視覚/音声の全方位進化

アリババがQwen3シリーズ全モデルをオープンソース化。新たに32Bパラメータモデルが登場し、1Mトークン対応、視覚理解、音声処理など多機能を統合。Apache 2.0ライセンスで商用利用も可能。

LibLibAI、ComfyUI最新対応とSD3生成を1秒短縮──ワークフロー最適化で差別化加速

LibLibAIがComfyUI最新版に対応し、SD3の生成時間を1秒に短縮。高速化とワークフロー最適化で、クリエイター向けAI画像生成プラットフォームとしての地位を強化。

GLM-Zero-Preview、リアルタイム推論でo1-miniを凌駕──DeepSeekから技術承継

Zhipu AIが発表した「GLM-Zero-Preview」は、独自の推論アーキテクチャとDeepSeek由来の強化学習技術を統合。数学・コーディング分野でo1-miniを上回る性能を実現し、中国製AIの技術力を証明。

百川智能(Baichuan)、世界最長の画像理解モデル「Baichuan-Omni-1.5」を発表──100万トークン対応

百川智能が「Baichuan-Omni-1.5」を発表。業界初の100万トークン画像理解を実現し、大量画像の同時処理が可能に。医療診断、金融分析、法務文書処理など実用分野での活用が期待される。

中国科技大学とアントG roup、「OpenR」フレームワークを公開──強化学習によるLLM推論能力の向上

中国科技大学とアントGroupが共同開発した「OpenR」は、強化学習でLLMの推論能力を向上させるオープンフレームワーク。既存モデルの性能を平均29.7%改善し、MIT Licenseで完全公開。

「AI師匠(AI老師傅)」を超える?中国で新たなAI活用法が注目──経験知識の体系化に成功

中国でDeepSeekなどのAIを活用した新たな知識管理手法が広まっている。専門家の暗黙知を体系化し、AIに学習させることで「AI師匠」を生み出す試みが成功。製造業から伝統工芸まで幅広い分野で応用が進む。

SenseTime、日本の生成AI市場でNVIDIAやAWSと協業加速

SenseTi(商湯科技)がNVIDIA、AWSとの戦略提携を強化し、日本市場での生成AI事業を本格展開。「日出(SenseNova)」プラットフォームを軸に、製造業やヘルスケア分野でのAI実装を推進。

バイドゥ、自動運転タクシー「蘿蔔快跑」がついに黒字化──世界初の収益化成功事例に

バイドゥの自動運転タクシー「蘿蔔快跑(Apollo Go)」が武漢で黒字化を達成。運行コストを人間ドライバーの60%まで削減し、累計800万回の運行実績。2025年内に複数都市で黒字化の見込み。

清華大学とテンセント、AIサッカープレイヤー「Cuju-7」を開発──多エージェント協調の新境地

清華大学とテンセントが共同開発した「Cuju-7」は、7対7のサッカーゲームで人間レベルの戦術理解と協調動作を実現。階層的強化学習により、個人技術とチーム戦術の両立に成功。

ByteDance、字節跳動の新AI「StreamVoice」が感情豊かな音声合成を実現──感情制御で差別化

ByteDanceが開発した「StreamVoice」は、感情パラメータで音声の感情表現を細かく制御できる次世代TTS。喜び、悲しみ、怒りなど7種類の感情を0-100のスケールで調整可能。商用展開も視野に。

Moonshot AIがKimi Explore発表──32K推論トークンでGPT-4o超えの能力

Moonshot AIの新モデル「Kimi Explore」は、32Kトークンの推論能力でGPT-4oやClaude 3.7を凌駕。独自のo1風アーキテクチャで複雑な問題解決に対応。API提供も開始予定。

テンセントがGitHub Copilot対抗「Tencent Cloud AI Code」を発表──中国語コード生成で差別化

テンセントが開発者向けAIコーディングアシスタント「Tencent Cloud AI Code」を正式リリース。中国語コメントや変数名に完全対応し、VS CodeやJetBrainsなど主要IDEをサポート。エンタープライズ版も提供。

アントグループ、医療AI「OpenMEDLab-2.5」をオープンソース化──25分野・4500万症例で学習

アントグループが医療特化型AI「OpenMEDLab-2.5」をオープンソース公開。25の医療分野、4500万症例のデータで学習し、診断精度95.7%を達成。Apache 2.0ライセンスで商用利用も可能。

アーカイブ

July /2025

June /2025

May /2025

April /2025

March /2025

February /2025

January /2025

December /2024