Zhipu(智譜)、GLM推論・基礎・思考モデルをオープンソース公開 新ドメイン「Z.ai」始動

出典:https://mp.weixin.qq.com/s/pyeqH8jGvH_dVPmekOQ1VQ

概要ポイント
  • GLMシリーズの32B/9BモデルをMITライセンスでオープンソース公開。
  • 推論モデルGLM-Z1-32Bは中国国内最速の推論性能(200トークン/秒)を達成。
  • DeepSeek-R1相当の性能で価格は1/30、圧倒的なコスト効率。
  • 新サイト「Z.ai」でGLMモデルを無料体験可能。
  • 思考型モデル「Rumination」は複雑な調査・研究にも対応。
本文

中国のAI企業Zhipu(智譜)は、大規模言語モデル「GLM」シリーズにおいて、32Bおよび9Bサイズの新たな基礎モデル・推論モデル・思考モデルをMITライセンスでオープンソース公開した。これにより、開発者や企業は商用利用を含む自由度の高い形で最新モデルを活用できるようになる。これらのモデルは、新たに開設された体験型プラットフォーム「Z.ai」や、法人向けAPIサービス「bigmodel.cn」でも提供されている。


まず、基礎モデル「GLM-4-32B-0414」は、国内外の大規模モデルに匹敵する性能を持ち、コード生成、関数呼び出し、検索型QA、レポート作成など多様なタスクに対応可能だ。15Tの高品質データを用いた事前学習に加え、人間のフィードバックに基づく調整や強化学習が施されており、対話やエージェントタスクで求められる高度な処理能力を備えている。


この基礎モデルをベースに開発された推論モデル「GLM-Z1-32B-0414」は、中国国内最速となる200トークン/秒の推論速度を実現しており、性能面では671Bパラメータを持つDeepSeek-R1と並ぶ水準にある。価格面では約1/30に抑えられ、コスト効率の点でも非常に優れている。数理推論、コード生成、論理的課題の解決といった高度な処理を得意とし、各種ベンチマークにおいても高い評価を得ている。


軽量版の「GLM-Z1-9B-0414」は、同様のアーキテクチャと訓練技術を採用しつつ、パラメータ数を抑えた設計で、計算資源が限られた環境においても優れた性能を発揮する。9Bサイズのオープンソースモデルとしてはトップクラスの実力を備え、軽量展開を求めるシーンに最適だ。


一方で、Zhipuは次世代のAGI(汎用人工知能)のあり方を見据えた思考型モデル「GLM-Z1-Rumination-32B-0414」も同時に公開した。このモデルは、自ら問題を設定し、情報を検索し、分析を構築し、最終的な回答に至るまでの「深い思考プロセス」を一貫して実行できるよう設計されている。検索ツールの統合、ルールベースの報酬設計、段階的な強化学習により、複雑な研究的タスクや調査課題への対応力が大きく向上している。


さらに、これらのモデルはZhipuのMaaS型サービス「bigmodel.cn」でも提供されており、用途やコストに応じた3タイプの推論モデルが用意されている。「GLM-Z1-AirX」は中国国内最速の推論性能を誇る高速モデル、「GLM-Z1-Air」は高頻度利用に適したコストパフォーマンス重視のモデル、「GLM-Z1-Flash」は無料で使用できるエントリーモデルとして展開されている。また、完全無料の基礎モデル「GLM-4-Flash-250414」も利用可能だ。


体験型プラットフォーム「Z.ai」では、以下3モデルの利用が可能となっている。「GLM-4-32B」は高性能なコード生成機能とArtifact表示機能を持つ基礎モデル、「Z1-32B」は超高速な推論性能を体験できる推論モデル、そして「Z1-Rumination-32B」は深い調査・研究タスクへの応用を想定した思考モデルである。


Zhipuは、これらのモデルを通じて開発者や企業に高性能かつ柔軟なAIモデルを広く提供し、GLMエコシステムの国際展開とAIの民主化を進めていく構えだ。