Baichuan AI(百川智能)、医療特化オープンソースモデル「Baichuan-M2」を発表──HealthBenchで世界首位、GPT-5に次ぐ複雑医療問題対応力

出典:https://mp.weixin.qq.com/s/VL2OWORdVDXkenXJ-Jw9Bg

概要ポイント
  • Baichuan-M2がHealthBenchで60.1点を記録し、全オープンソースモデルで世界1位。
  • RTX4090単一GPUで運用可能な軽量化を実現し、導入コストを大幅削減。
  • 医療特化強化学習とAI患者シミュレーターで性能を飛躍的に向上。
  • 中国臨床ガイドラインに準拠し国内医療現場での有用性を強化。
  • 複雑医療問題対応でGPT-5に次ぐ世界2位のスコアを達成。
本文

Baichuan AI(百川智能)は、医療分野に特化したオープンソース大規模モデル「Baichuan-M2」を正式発表した。本モデルはOpenAIの最新オープンソースモデルを上回り、医療能力評価ベンチマーク「HealthBench」で60.1点を獲得し、全オープンソースモデル中世界1位となった。さらに、OpenAIが設けた難易度の高い「HealthBench Hard」では34.7点を記録し、GPT-5に次ぐ世界2位を達成している。


M2は32Bサイズの小型構成ながら、量子化と最適化によりRTX4090単一GPUで運用可能とし、DeepSeek-R1のH20双ノード構成に比べ導入コストを57分の1に削減。国産主流チップへの適合も進め、国内医療機関が既存ハードウェアで迅速に導入できる環境を整えた。また、Eagle-3アーキテクチャによる高速化版「MTP」では単ユーザー環境で約75%のトークンスループット向上を実現した。


性能向上の鍵は、大型検証システムとAI患者シミュレーターを組み合わせた多段階強化学習にある。患者シミュレーターは多様な年齢・性別・症状を持つ仮想患者を生成し、現実に近い医療対話データを大量に作成。これにより、医学的正確性や安全性を多角的に評価しながらモデルの臨床推論能力を磨いた。学習データは医療・汎用・数学推論をバランス良く組み合わせ、通用能力の低下を防いでいる。


さらに、中国の臨床診療ガイドラインや患者特性に沿った最適化も実施。例えば肝細胞癌治療では、最新の国家衛健委ガイドラインに基づき外科的切除を推奨するなど、国内実情に即した診療方針を提示する。実地テストでは、甲状腺機能低下症や小児呼吸器疾患などの症例で主任医師クラスの推論を行い、多診療科合同カンファレンスでも高い評価を得た。


Baichuan-M2は、低コストで世界水準の医療推論性能を提供する唯一のオープンソースモデルとして、医療現場への即時導入と幅広い応用が可能な点で注目を集めている。