チャイナAI速報

January 29/2025

Alibaba Cloud、新世代AIモデルQwen2.5-Maxを発表 – 主要ベンチマークで最高評価

Alibaba Cloudは、最新の大規模言語モデル「Qwen2.5-Max」を発表した。新モデルは20兆トークン以上のデータで事前学習され、知識、プログラミング、総合評価、人間の好みに対する適合性といった主要ベンチマークで世界最高水準の性能を記録した。Claude-3.5-SonnetやGPT-4oと肩を並べ、主要なオープンソースモデルを上回る結果となった。現在、開発者はQwen Chatで無料体験でき、企業はAlibaba CloudのAPIを通じて活用可能だ。

January 27/2025

Janus-Pro: 次世代の統合型マルチモーダル理解・生成モデルが登場

DeepSeekは、新たに高度化した統合型マルチモーダルモデル「Janus-Pro」を発表。従来のJanusモデルに対し、データとモデルのスケーリングを強化し、マルチモーダル理解および視覚生成の精度を大幅に向上させた。最適化されたトレーニング戦略と拡張されたデータセットを活用し、テキスト・画像間の統合的な推論能力を高めた。

January 26/2025

Baichuan社、多モーダル対応モデル『Baichuan-Omni-1.5』を公開――医療AI分野でGPT-4o miniを凌駕

Baichuan社の多モーダルモデル「Baichuan-Omni-1.5」はGPT-4o miniを超え、医療AIの精度・効率向上が期待される。最適化で“模型降智”を克服し、ASR・TTS搭載やOpenMM-Medicalなどの評価基盤を公開して多様な応用を視野に入れる。

January 23/2025

ByteDance、AGI最前線へ――新プロジェクト『Seed Edge』始動

ByteDanceは2025年1月に「Seed Edge」を発足。AGI向け5つの基礎研究を長期的に推進し、既存チーム“Seed”より深化した挑戦的な研究体制を整備。トップダウンの支援で論文発表も盛んに行い、AI技術の革新へ注力する。

January 22/2025

「豆包1.5Pro」正式発表：多モーダル・推論能力を大幅強化

ByteDanceの豆包（Doubao）チームは、新世代の大規模言語モデル「豆包1.5Pro」を発表。知識、コード、推論、中国語など幅広い分野で評価が向上し、MoE構造により高い効率と低コストを実現。視覚・音声の多モーダル対応も強化され、API公開により開発者向けの利用も可能。訓練データは他のモデル生成データを使用せず、独自のデータ生産体制を採用。今後も研究開発を推進する方針。

Step-Video V2公開：次世代のリアルな動画生成AIが登場

中国のStepFun（階躍星辰）が、動画生成モデル「Step-Video V2」を発表した。V2は前バージョンよりも大幅に進化し、複雑な動作、美的表現、文字生成、カメラワークなどの性能が向上。新たに強化されたVAEモデル、DiTアーキテクチャ、マルチモーダル技術により、リアルで高品質な動画を生成できる。現在、ウェブ上で試用申請が可能。

January 21/2025

テンセント、「混元3D AI創作エンジン」を公開—3D生成AIの新たな展開

テンセントは1月21日、3D生成AIの最新バージョン「混元3D 2.0」を発表し、同時に「混元3D AI創作エンジン」を公開した。新バージョンではテキストや画像からの3D生成精度が向上し、低ポリゴンモデルやアニメーション生成に対応。オープンソース化を進め、ゲーム開発や工業デザインなど多分野での活用を目指す。AIによる自動生成を活用し、3D制作の効率化とコスト削減を実現する。

January 20/2025

DeepSeek-R1が公開、OpenAI o1相当の性能を達成し小モデル展開も可能に

DeepSeekが新モデル「DeepSeek-R1」をMITライセンスで公開し、強化学習と最小限の注釈データでOpenAI o1に匹敵する推論性能を達成。R1の出力を利用して小型モデルを生成し、複数のサイズをコミュニティに提供。ライセンスや利用規約を緩和し、研究者や開発者が自由に再学習・改変を行える環境を整備した。

Kimi、新世代AIモデル「k1.5」発表—多モーダル推論能力を大幅強化

AIアシスタント「Kimi」を提供するMoonshot AIは、新たに「k1.5 多モーダル思考モデル」を発表した。数学、コード、視覚分野においてSOTAレベルの推論能力を達成し、OpenAIのo1モデルと並ぶ性能を実現。さらに、モデル訓練の詳細な技術レポートも初公開された。今後、さらなる強化学習の拡張により、汎用性と多分野対応力を向上させる計画だ。

January 15/2025

科大訊飛、星火深度推理モデルX1を発表—数学能力の向上と業界応用を強化

科大訊飛（iFLYTEK）は、新たな大規模AIモデル「星火深度推理モデルX1」を発表した。数学推理能力を強化し、教育、医療、金融などの分野での応用を推進。さらに、「星火4.0 Turbo」をアップグレードし、長文理解や画像解析機能を強化した。新たに発表された「星火音声同時通訳モデル」は、リアルタイム翻訳の精度向上を実現し、翻訳業界の効率化に貢献するとみられる。

January 10/2025

通義灵码AIプログラマー正式リリース：AIと連携した効率的なコーディング環境を提供

Alibaba Cloudの通義灵码AIプログラマーが正式にリリースされた。本ツールはVS CodeやJetBrains IDEsと連携し、多言語対応のコーディング支援を提供する。新機能として、多ファイルコード修正や単体テストの自動生成を導入し、開発者がAIとの対話を通じて、要件定義からバグ修正まで効率的に進行可能。開発プロセスの自動化により、プログラミング作業の負担軽減と生産性向上が期待される。

January 9/2025

通義万相2.1、AI動画生成能力を大幅強化 – VBenchランキングで首位獲得

Alibaba CloudのAI映像生成モデル「通義万相」がバージョン2.1へと進化し、大幅な性能向上を遂げた。自社開発の高効率VAEとDiTアーキテクチャを採用し、時間・空間の文脈理解能力を強化。1080Pの長時間動画の効率的なエンコード・デコードに対応し、初めて中国語テキスト動画の生成を実現した。今回のアップデートにより、VBenchランキングで1位を獲得。より滑らかでリアルな動作や、映画のような映像美を表現できる。

清言プラグイン、検索・AI回答・学術日刊レポート機能を搭載

智譜清言ブラウザプラグインがv1.0.18版として全面更新された。検索エンジンアシスタント、AI検索、学術日刊レポートの三大機能が搭載され、キーワード入力により全ウェブ情報の要約、包括的な回答、最新論文情報が自動的に提供される仕組みである。