チャイナAI速報

September 30/2025

Zhipu AI、旗艦モデル「GLM-4.6」を公開──Claude Sonnet 4同等のコード能力、中国製半導体チップ最適化も実現

Zhipu AIは最新大規模モデル「GLM-4.6」を発表。コード性能でClaude Sonnet 4と同等水準に到達し、長文処理や推理・検索・文生成能力も向上。Cambricon（寒武紀）やMoore Threads（摩尔线程）の中国製半導体チップに最適化し、推論コスト削減を実現。

September 29/2025

DeepSeek、試験版（Experimental版）「V3.2-Exp」公開──スパース注意機構で長文処理を効率化、APIは半額に

DeepSeekは新たな試験版「V3.2-Exp」を公開。スパース注意機構で長文処理を効率化しつつ精度を維持。API価格を50%以上引き下げ、HuggingFaceやModelScopeでオープンソース公開された。

September 28/2025

テンセント、HunyuanImage 3.0を公開──80Bのネイティブ型マルチモーダル生画像モデルをオープンソース化

テンセントがHunyuanImage 3.0を開源公開。80B規模のネイティブ型モデルで、長文や小さな文字を含むテキストからの画像生成精度を強化。現時点は文生図のみ提供し、モデル重みを無償配布。

September 26/2025

テンセント、Hunyuan3D-OmniとPartを発表──ゲームや3Dプリントに向け全面オープンソース化

テンセントは「Hunyuan3D-Omni」と「Hunyuan3D-Part」を発表し全面オープンソース化。多条件制御による高精度生成と部品単位での柔軟な分割生成を実現し、ゲーム、3Dプリント、AR/VRなど産業応用を加速する。

Tripo 3.0正式リリース──StandardとUltra二重モードで精度と効率を両立

Tripoは3D生成AIの最新版「Tripo 3.0」を発表。Standardモードは安定性と実用性を重視、Ultraモードは高精細表現に特化。映像制作からゲーム開発まで幅広く活用可能。

September 25/2025

JingDong（京東）、AI技術を全面オープンソース化──JoyAgent 3.0やOxyGentなど企業向け基盤を公開

JingDong（京東）がAI基盤を一斉にオープンソース化。JoyAgent 3.0はデータ分析とガバナンス機能を追加し、OxyGentはPythonベースの多エージェント開発を可能にした。医療大モデルや推論フレーム、安全基盤まで全方位で公開し、産業利用の壁を下げる戦略を示した。

アリババのTongyi LabはQwen3-VLを公開──視覚エージェント、2D/3Dの物体位置特定、長いコンテキスト対応を強化

アリババのTongyi Labは視覚言語モデル「Qwen3-VL」を公開。旗艦モデルQwen3-VL-235B-A22B（Instruct/Thinking）をオープンソースで提供し、視覚エージェント、2D/3Dの物体位置特定（グラウンディング）、長いコンテキスト対応、多言語OCRなどを強化した。

September 23/2025

アリババのTongyi Lab、新オープンソース画像編集モデル「Qwen-Image-Edit-2509」を公開──複数画像合成とControlNet標準対応で表現力を強化

アリババのTongyi Labは新モデル「Qwen-Image-Edit-2509」を発表。複数画像合成やControlNet標準対応により自然な合成やポーズ変更が可能になり、古い写真の修復や文字編集も強化。さらに全モダリティ対応の「Qwen3-omni」も同時公開した。

September 22/2025

DeepSeek、最新版「V3.1-Terminus」を公開──言語一貫性とAgent能力を改善

DeepSeekは大規模モデルを最新版「V3.1-Terminus」に更新。中英混在や異常文字を軽減し、Code AgentとSearch Agentの性能を最適化。安定性が向上し、AppやAPIも全て同期更新された。

Meituan（美団）、オープンソース推論特化モデル「LongCat-Flash-Thinking」を公開──数理・コード・エージェント推論でSOTAを更新

Meituan（美団）が推論特化の新モデル「LongCat-Flash-Thinking」をオープンソース公開。高速性を維持しつつ数理・コード・エージェント推論でSOTAを達成。形式的な証明や高度な推論も可能で、中国先行の統合型モデルとして注目される。

September 21/2025

ListenHub創業者が語るAIポッドキャストの未来──「創作者のAI代弁者」として音声Agent時代へ

ListenHubはAIポッドキャストを「創作者のAI代弁者」と定義し、事実性と臨場感を重視。FlowSpeechで書き言葉を自然な口語に変換、有料プラン設計とMVP戦略で音声Agent時代の基盤を築く。

September 19/2025

アリババのTongyi Lab、Wan2.2-Animateをオープンソース公開──モーション模倣とキャラクター置換を1モデルで実現

アリババのTongyi LabがWan2.2-Animateを公開。1枚の画像と参考動画からモーション模倣とキャラクター置換を両立し、ショート動画制作やアニメ生成に応用可能。

シャオミ（Xiaomi）、音声分野の転換点──ネイティブE2E音声大モデル「MiMo-Audio」をオープンソース公開

シャオミはエンドツーエンド音声大モデル「MiMo-Audio」をオープンソース公開。1億時間規模の無損失圧縮音声データで訓練し、少数サンプルでの汎用化能力を実現。GoogleやOpenAIのクローズドソースモデルを超える性能を示し、音声AGI研究の基盤を築いた。

テンセント、Hunyuan「3D Studio」を発表──ワンストップAI制作プラットフォームで3D制作を分単位に短縮

テンセントは3D制作向けのHunyuan「3D Studio」を公開。概念設計からモデル生成、マテリアル生成、アニメーションまで自動化し、制作期間を日単位から分単位に短縮。最新「Hunyuan 3D 3.0」モデルは36億ボクセル対応で精度3倍を実現。

September 18/2025

DeepSeek-R1論文、Nature表紙に掲載──強化学習で推理能力を育成した初のLLM

DeepSeek-R1がNature表紙に登場。強化学習でLLMの推理力を向上させた研究が高く評価され、初の学術誌査読通過LLMとして注目を集めた。透明性と再現性がAI研究に新たな基準を示した。

September 17/2025

アリババ、Tongyi LabのDeepResearchをフルオープンソース化──研究型AIの新たな訓練パラダイムと実応用

アリババのTongyi Labは研究型AI「DeepResearch」を全面オープンソース化。自動合成データや新訓練パラダイムを公開し、地図や法律分野への応用も進展している。

Skywork、新エージェント「AI Developer」を公開──非エンジニアでもフルスタックWebアプリを構築可能に

Skywork Super Agentsが新たにVibe Coding Agent「AI Developer」を公開。非エンジニアでも自然言語でフルスタックWebアプリを構築でき、Supabase統合やStripe決済、Resendメール通知などを備え、開発と展開のハードルを大幅に下げた。

September 16/2025

テンセント、超精細3D生成モデル「Hunyuan 3D 3.0」を公開──人物表現と幾何構造を大幅強化

テンセントは「Hunyuan 3D 3.0」を発表。モデリング精度3倍、1536³の高分解能と36億ボクセルに対応し、人物生成のリアルさと複雑構造の再現力を強化。無料利用やAPI公開に加え、プロ向けStudioやOmniモデルのオープンソース化も進行中。

Meizu（魅族）、AI眼鏡「StarV Snap」を1999元（約4.5万円）で発売──39gの軽量設計で翻訳・撮影・決済に対応

Meizu（魅族）はAI搭載スマートグラス「StarV Snap」を1999元（約4.5万円）で発表。39gの軽量設計で12言語同時翻訳、AI認識、決済、写真・動画撮影を実現。アリペイ（支付宝）連携で日常利用にも浸透を狙う。

September 12/2025

アリババ、Qwen3-Nextを発表──長文処理と推論効率で革新、80Bモデルをオープンソース公開

Qwen3-Nextを公開。ハイブリッド注意機構と高スパースMoEで効率を刷新し、80B規模ながら推論時は約3Bのみ稼働。長文推論はQwen3-32B比で10倍超のスループット。Hugging Face等で利用可能。

アリババとバイドゥ、自社開発チップで次世代AI訓練──H20に匹敵、中国AIは「脱NVIDIA」へ加速

アリババとバイドゥが自社開発チップでAIモデル訓練を開始。性能はNVIDIA H20に匹敵し、米国規制下で「脱NVIDIA」への転換が進む。数千億元（数兆円）規模の投資により、中国AI産業の計算能力国産化が現実味を帯びてきた。

MiniMax、「Music 1.5」を公開──4分曲生成と人声・編曲の進化で“好听”を追求

MiniMaxは新世代音楽生成モデル「Music 1.5」を発表。最大4分の楽曲生成に対応し、歌声の自然さ、編曲の多層性、楽曲構造の明瞭さを実現。音楽制作の敷居を下げ、「好听（心地よい音楽）」の本質に回帰する進化を示した。

September 10/2025

テンセント、HunyuanImage 2.1を公開──2K解像度・文字生成に対応したオープンソース画像生成モデル

テンセントが画像生成モデル「HunyuanImage 2.1」を発表。2K解像度や中英文字生成に対応し、美学表現と性能を強化。ジブリ風やデフォルメキャラも生成可能で、Hugging FaceやGitHubでオープンソース公開された。

September 9/2025

バイドゥ（百度）、ERNIE X1.1を発表──事実性・命令遵守・エージェント能力を大幅強化

バイドゥ（百度）はWAVE SUMMIT 2025で「ERNIE X1.1」を発表。事実性や命令遵守、エージェント性能が向上し、DeepSeek R1を超える評価を獲得。さらにデジタルヒューマン技術、PaddlePaddle v3.2、ERNIE Code 3.5Sなども披露。

中国AIクラウド市場でアリババが首位──シェア35.8%、フルスタック戦略で競合を圧倒

Omdia「中国AIクラウド市場 1H25」によれば、2025年上半期の市場規模は223億元（約4,683億円）。アリババクラウドはシェア35.8%で首位、2〜4位合計を上回る。MaaS層の高成長と大型投資が追い風。

September 8/2025

Meituan（美団）、5600億パラメータの大規模モデル「LongCat-Flash」をオープンソース公開──DeepSeek v3.1やQwen3を超えAgenticタスクで新SOTA

Meituan（美団）が大規模MoEモデル「LongCat-Flash」をオープンソース公開。5600億パラメータのうち平均270億を動的活性化し効率を最適化。DeepSeek v3.1やQwen3を超えAgenticタスクでSOTAを更新。

Mureka V7.5、10言語AIシングル「Digital Heartbeat」MVをグローバル公開

Kunlun TechのAI音楽プラットフォームMurekaが、V7.5モデル生成の10言語シングル「Digital Heartbeat」公式MVを公開。V7.5は中国語楽曲における声質・発音・感情表現を強化し、APIでの統合も可能。

September 6/2025

アリババ、超1兆パラメータの「Qwen3-Max-Preview」を公開──世界最先端性能を実証

アリババのTongyi Labは超1兆パラメータの新モデル「Qwen3-Max-Preview」を公開。主要ベンチマークでClaude-Opus 4やDeepSeek-V3.1を超える性能を示し、阿里雲百煉とQwen Chatで利用可能となった。

テンセント、ナレッジベースフレームワーク「WeKnora」をオープンソース公開──API対応で自動化と業務活用を拡張

テンセントは文書検索フレームワーク「WeKnora」をGitHubで公開。imaの制約を解消し、API連携やローカル・クラウド両対応のナレッジベース構築を可能にした。企業利用やワークフロー統合に最適。

September 5/2025

テンセント、ゲーム向けAI生成プラットフォーム「Hunyuan Game 2.0」を正式公開──全機能を一般開放

テンセントは「Hunyuan Game」2.0を公開し、画像→動画生成、LoRA簡易訓練、キャラのディテール強化などを追加。ゲームアート制作に特化した生成能力は業界SOTA水準に到達し、制作効率を数十倍に高める。

Zhipu AI、Claude利用停止に対応し「Claude APIユーザー特別移行プラン」を発表

Anthropicが中国資本関与企業へのClaude提供を停止。Zhipu AIは「Claude APIユーザー特別移行プラン」を開始し、GLM-4.5への一鍵移行、無料トークン、低価格高速プラン、企業向け専用サポートを提供する。

Moonshot AI、Kimi K2モデルをアップデート──コード性能強化と256K文脈拡張、高速APIも提供

Moonshot AIがKimi K2の0905版を公開。コード能力や前端体験を改善し、文脈長を256Kに拡張。高速APIで最大100 Token/sを実現し、開発者環境を最適化。

September 4/2025

オープンソース3D AI「Super Agent Party」公開──Bilibili配信やIoT制御に対応する多機能AIパートナー

Super Agent Partyは従来の「デスクトップペット」を超えたオープンソースAIプラットフォーム。知識検索、マルチモーダル、コード実行、IoT制御に対応し、Bilibili配信やWeChat/QQでも活用可能。

Allride.ai（中智行）が破産清算──王勁（Wang Jing）の自動運転起業に幕

バイドゥ自動運転部門初代総経理の王勁（Wang Jing）が創業したAllride.ai（中智行）が破産清算へ。景馳科技（Jingchi Technology）からの分裂後、道路協調型を掲げたが資金難と実用化の壁で失速し、事業継続不能に。

ディズニー、AIアニメとショートドラマに賭ける──Accelerator Program 2025の核心

ディズニーは2025年のAccelerator ProgramでAIアニメのAnimajとショートドラマ配信のDramaBoxに出資。制作効率の革新と新たな物語形式への対応を狙い、IP活用の多様化と収益モデル拡張に挑む。

August 30/2025

米VC a16z「米国AI新興の8割は中国オープンソース依存」──世界オープンソースランキング上位16席も中国勢独占

a16zのパートナーCasado氏によると、米国AIスタートアップの約8割が中国のオープンソース大規模AIモデルを利用。Design Arenaの世界オープンソースランキングでは上位16モデルを中国が独占し、同分野で圧倒的優位を示す。

August 29/2025

Hailuo AIの「Start/End Frames」機能を正式公開──複雑指令理解と極限物理動態で映像生成を進化

Hailuo AIは新世代「Start/End Frames」機能を公開。複雑な指令遵循、極限物理動態、大幅な運鏡、自由な想像力、さらに「End Frameのみ」生成に対応し、映像生成の精度と表現力を大幅に拡張した。

August 28/2025

テンセント、動画音声生成モデル「HunyuanVideo-Foley」をオープンソース公開──無声AI動画に終止符

テンセントは動画音声生成モデル「HunyuanVideo-Foley」を公開。映像とテキスト入力から映画級の音響を生成し、従来の無声AI動画の限界を突破。短動画や映画、広告、ゲーム開発に応用可能。

問小白5（Wenxiaobai 5）公開──AA-Index 64.7でGemini 2.5 Pro超、GPT-5級性能を主張

問小白（Wenxiaobai）開発チームが“All in One”旗艦モデル「問小白5」を発表。AA-Index 64.7でGemini 2.5 Pro超と主張し、STEM 86、HLE 17.7、LiveCodeBench 79.2、IFBench 58.1を提示。統合判断で高速応答と熟考を切替。

August 26/2025

アリババ「Wan2.2-S2V」公開──画像＋音声から映画級のバーチャルヒューマンライブ生成

アリババのTongyi Labが新モデル「Wan2.2-S2V」をオープンソース公開。画像と音声から自然な表情と動作を備えたバーチャルヒューマンライブ動画を生成し、長尺映像や多様な応用に対応。

August 25/2025

アリババ、DingTalk（釘釘）でAI 1.0を発表──業務情報フィード・AI検索・AIスプレッドシート・AI議事録・AIハードウェアを一斉公開

アリババはDingTalk（釘釘）でAI 1.0を発表し、業務情報フィード、企業向けAI検索、AIスプレッドシート、AI議事録、AIハードウェアA1など10以上の新製品を公開。AIが業務基盤を再定義する新時代を提示した。

XVERSE（元象科技）、AI+3Dで「完全リアルインターネット」へ──大規模モデルと3D技術で次世代デジタル世界を構築

XVERSE（元象科技）はAIと3Dの両輪で「完全リアルインターネット」を構想。独自3DエンジンやAIGCツール、VR体験店、MoE大規模モデルを展開し、AI×3Dの融合でリアルかつ知能的なデジタル世界を推進している。

August 21/2025

DeepSeek、最新モデル「DeepSeek-V3.1」を公開──思考モード切替とエージェント強化へ

DeepSeekは新モデル「DeepSeek-V3.1」を発表。思考／非思考モードの切替機能を搭載し、エージェント性能や推論効率を大幅に改善。128Kコンテキスト対応、Function Calling強化、Claude Codeとの互換性も提供。モデルはHugging FaceとModelScopeで公開された。

バイドゥ（百度）、動画生成AI「蒸汽機2.0」を公開──330元（約7,000円）で映画級動画制作が可能に

バイドゥ（百度）は動画生成AI「蒸汽機2.0」を発表。音声と映像をミリ秒単位で同期し、複数キャラ対話や映画級運鏡を実現。価格は中国国内の他社モデルの70％、5秒動画は1.4元（約30円）から利用可能。VFX監督の姚騏（Yao Qi）はわずか330元（約7,000円）で2分間のSF短編を制作。

August 20/2025

Tripo 3.0発表──AI 3D生成が「IMAX時代」に突入、精細度と実用性を大幅強化

Tripoが最新版「3.0」を発表。高精細3D生成を可能にし、標準とUltraの二重モードを搭載。Flux/GPT-4o統合やT-Pose生成、貼図筆、智能拆件など5大新機能で、ゲーム・映画・設計まで幅広い応用を目指す。

Zhipu AI「AutoGLM 2.0」正式発表──クラウド実行型の万能モバイルAgent

Zhipu AIがAutoGLM 2.0を発表。世界初のクラウド実行型モバイルAgentとして、スマホやPCを占有せずにデリバリー注文からSNS投稿まで自動実行。GLM-4.5/4.5Vを基盤に24時間稼働を実現し、誰でも利用可能に。

August 19/2025

アリババ・Tongyi Lab、全能画像編集モデル「Qwen-Image-Edit」を公開──テキスト精度と編集自由度を両立

アリババのTongyi Labは画像生成基盤モデルを拡張した「Qwen-Image-Edit」を公開。テキストの精密編集や外観・意味の両面での編集を実現し、SOTA性能を達成。幅広い応用が可能。

August 18/2025

AI競争の焦点は電力網──中国の先行投資と米国の停電リスク

AIの急成長を支える鍵は電力供給に移行。米国は脆弱な電力網と資金調達構造の制約で停電リスクに直面する一方、中国は長期的な先行投資により余剰電力を確保し、AI産業の拡張に優位を築いている。

August 15/2025

テンセント、Hunyuan 3D世界モデルLite版を公開──消費級GPUで動作可能に

テンセントは「Hunyuan 3D世界モデル1.0」のLite版を発表。消費級GPUでの動作を可能にし、従来26GB超の必要VRAMを17GB以下に削減。高品質な360°シーン生成や可編集性を維持しつつ、個人開発者や中小企業も利用可能となった。

アリババTongyi Lab、WebWatcherを公開──マルチモーダルDeep Researchを実現するオープンソース視覚エージェント

アリババのTongyi Labが発表したWebWatcherは、画像・テキスト・コードを横断的に理解し推論するオープンソース視覚エージェント。BrowseComp-VLなど高難度ベンチマークでGPT-4oやGeminiを凌駕し、マルチモーダルDeep Researchの新基準を築いた。

Kunlun Tech、SkyWork発表週を完結──Mureka V7.5とMoE-TTSでAI音楽と音声合成が新段階へ

Kunlun TechはSkyWork AI技術発表週を締めくくり、AI音楽生成モデルMureka V7.5と音声合成フレームワークMoE-TTSを発表。中国語楽曲の表現力強化と自然言語による声質制御を実現し、音楽・バーチャルヒューマン領域の革新を示した。

miHoYo創業者蔡浩宇（Cai Haoyu）、AIゲーム新作『Whispers from the Star』をSteamで公開──AI少女Stellaが「感情」を持つ存在に

miHoYo創業者蔡浩宇（Cai Haoyu）が立ち上げたAI企業Anuttaconが、AI駆動のインタラクティブゲーム『Whispers from the Star』をSteamで公開。AI少女Stellaがリアルタイムで感情反応し、従来の対話型ゲームを超えた“曖昧さと揺らぎ”を体験できる新境地を提示。

August 14/2025

テンセント、時価総額7,000億ドル回復──AIと海外ゲームが成長を牽引

テンセントは2025年第2四半期決算でAI活用と海外ゲーム事業が成長を牽引し、市場予想を上回る業績を達成。広告・ゲーム・クラウドでAIが収益化段階に入り、国際市場拡大も加速。時価総額は7,000億ドル（約102兆円）に回復。

August 13/2025

Kunlun Tech、統合型マルチモーダル生成モデル「Skywork UniPic 2.0」を完全オープンソース化──軽量高性能な生成・編集一体化を実現

Kunlun Techが「Skywork UniPic 2.0」を公開。2B規模ながら既存大規模モデルを超える生成・編集性能を持ち、統合型マルチモーダル理解・生成・編集を実現。Flow-GRPO強化戦略で性能を最適化し、モデル・コード・戦略を全面開放。

August 12/2025

テンセント、Hunyuan Large-Visionを発表──LMArena Visionで中国勢トップ、マルチ言語・多モーダル理解を強化

テンセントが多モーダル理解モデル「Hunyuan Large-Vision」を発表。LMArena Visionで中国勢トップ、GPT-4.5級の性能を達成。任意解像度画像・動画・3D入力に対応し、多言語理解と推論能力を強化。

Kunlun Tech、世界モデル「Matrix-Game 2.0」をオープンソース公開──Genie 3同等性能を汎用シーンで実現

Kunlun Techが自社開発の「Matrix-Game 2.0」を公開。Genie 3同等のリアルタイム長尺生成を汎用シーンで実現し、業界初の全面オープンソース化を達成。25FPSで複雑な環境の長時間インタラクション生成が可能。

Notion CEO Ivan Zhaoが語る──AI時代の理想は「自在に形を変えられる」統合型ツール、断片化を越えてAIを“チームメイト”化

Notion CEOのIvan Zhaoは、SaaS時代の縦割りツールによる情報分断を指摘し、モジュール式統合プラットフォームの重要性を強調。AI時代にはツールを“AIチームメイト”として能動的に働かせる未来を描き、安定性と長期記憶の付与を課題に据える。

バイトダンス、プロンプト最適化ツール「PromptPilot」を公開──生成から評価まで一括支援

バイトダンスが公開した「PromptPilot」は、プロンプトの生成・調整・評価・管理を一括で支援する無料ツール。曖昧な指示を構造化し、高品質なプロンプトへ自動変換。Doubao（豆包）モデルにも対応し、初心者から上級者まで活用可能。

August 11/2025

Kunlun Tech、音声駆動型バーチャルヒューマン生成モデル「SkyReels-A3」発表──写真と音声から自然な動きを持つ映像を生成

Kunlun TechがSkyReels-A3を公開。音声駆動で写真や動画に口の動きや表情、しぐさを自然に付与し、任意長の映像生成を実現。DiT動画拡散モデルと精密なカメラワーク制御により、広告・ライブ配信・MVなど多様な場面で高精度かつ長尺のバーチャルヒューマン映像制作が可能に。

Baichuan AI（百川智能）、医療特化オープンソースモデル「Baichuan-M2」を発表──HealthBenchで世界首位、GPT-5に次ぐ複雑医療問題対応力

Baichuan AIが医療強化型オープンソースモデル「Baichuan-M2」を公開。OpenAI最新開源モデルを性能で上回り、HealthBenchで世界トップに。小型・低コスト化や中国臨床シナリオ最適化で実用性を高め、複雑医療問題でもGPT-5に次ぐ成績を記録。

GLM-4.5V発表──Zhipu AI（智譜）、100B級オープンソース多機能推論モデルを公開

Zhipu AI（智譜）は総パラメータ106Bのオープンソース多機能推論モデル「GLM-4.5V」を公開。画像・動画・文書・GUIなど全シーンに対応し、精度と速度を両立。多様な実例で人間水準を超える性能を示し、開発者向けにAPIやデスクトップアプリも提供。

Creality（創想三維）、AIモデリングプラットフォームMakeNowにテンセントHunyuan 3Dを統合──消費者向け3D創作の進化を加速

Creality（創想三維）はAIモデリングプラットフォームMakeNowにテンセントHunyuan 3D v2.5を統合し、消費者向け3Dモデル生成能力を強化。初心者でも写真1枚で高精細な3Dフィギュアを生成可能となり、3D創作エコシステムの進化を加速。

August 8/2025

シャオミ（Xiaomi）、MiMo-VLマルチモーダルAIモデル最新版を公開──推理・文書・GUI・動画理解で性能向上、思考モード切替にも対応

シャオミ（Xiaomi）がマルチモーダルAIモデル「MiMo-VL-7B-2508」をSFT版・RL版でオープンソース公開。推理・文書・GUI・動画理解の精度向上と、思考／非思考モード切替機能を搭載し、安定性も強化。

August 7/2025

MiniMax、音声生成モデル「Speech 2.5」発表──40言語対応・高精度な音色復刻で世界トップ性能を更新

MiniMaxが最新音声生成モデル「Speech 2.5」を発表。中文・英文を含む40言語に対応し、音色再現性や多言語表現力が大幅に向上。商用・教育・クリエイティブ分野での応用が加速。従来モデルを超える表現力で、グローバル展開を後押しする。

August 5/2025

アリババのTongyi Lab、20B画像生成モデル「Qwen‑Image」をオープンソース公開──複雑な文字描写や精密編集を強化

アリババのTongyi Labが、20Bパラメータの画像生成モデル「Qwen‑Image」を公開。複雑な文字描写や高精度な画像編集、ポスターやPPTの自動生成にも対応し、AI画像生成の新たな標準を提示した。

Zhipu AI（智譜）、「Zread」を発表──GLM-4.5搭載のAIツールでコード理解と文書生成を一括支援

Zhipu AI（智譜）は、GLM-4.5を基盤にした開発支援ツール「Zread」を発表。GitHubリポジトリから自動で構造解析と技術文書を生成し、過去コードの理解やチームナレッジの構築までを支援する。

August 4/2025

テンセント、Hunyuan 0.5B～7Bを一挙オープンソース化──消費者向け端末で動作、エージェント機能や長文処理に対応

テンセントはHunyuan 0.5B～7Bをオープンソース化。一般向けGPUで動作可能で、エージェント機能や256k長文処理に対応。PCやスマホへの直接展開が可能になり、産業応用が加速する見通し。