7.6 C
Tokyo
2025年02月11日火曜日
ホームニュースIT・テックスタンフォード大学とワシントン大学、50ドル未満で開発したAI推論モデル「s1」公開 最先端の推論能力を実現

スタンフォード大学とワシントン大学、50ドル未満で開発したAI推論モデル「s1」公開 最先端の推論能力を実現

引用:AFP通信
引用:AFP通信

米スタンフォード大学とワシントン大学のAI研究チームは、蒸留技術を活用し、わずか50ドル(約7,598円)未満で開発したAI「推論」モデル「s1」を公開した。この成果は、ディープシークのAIモデル「R1」と同様、世界中に衝撃と希望をもたらした。

7日(現地時間)、米IT専門メディア『テッククランチ』によると、このAI推論モデルはディープシークの「R1」にちなんで「s1」と名付けられ、最先端の推論能力を備えている。

「s1」は、数学やコーディング能力において、オープンAIの「o1」やディープシークの「R1」と同じレベルの性能を発揮する。研究チームは、GitHubを通じて、関連データやコードとともに、このモデルを公開し、誰でも利用できるようにした。

また、s1の開発において、研究チームは特別にモデルを開発する代わりに、一般に入手可能な基本モデルを基にAIを構築し、ディープシークも活用したとされる「蒸留技術」を用いて精緻に仕上げたと述べている。この技術を活用して、他のAIモデルの「推論」能力を抽出し、回答を引き出す方法を模索した。

その上で、研究チームはs1がGoogleのAI推論モデル「Gemini 2.0 Flash Thinking Experimental」から蒸留されたことを明かしている。

先月、カリフォルニア大学バークレー校の研究チームも同様に、この蒸留技術を用いて約450ドル(約6万8,388円)でAI推論モデルを作成している。

s1は、中国のアリババ傘下のAI研究所Qwenが無料配布する小型モデルを基に作成された。研究チームは、s1の訓練に際し、精緻に組み合わせた1,000個の質問を用意し、それに対する回答を同時に提示した。また、GoogleのGemini 2.0 Flash Thinking Experimentalからも回答を得て、その過程での「思考(シンキング)」もAIに提供した。

訓練は、NVIDIA H100 GPU 16台を使用し、わずか30分足らずでs1が特定のAI基準を満たすレベルに達することができた。

スタンフォード大学の研究員ニクラウス・ミューニンホフ氏は、このs1訓練に必要な計算能力が現在約20ドル(約3,039円)でレンタル可能であると述べている。

テッククランチは、R1やs1の事例を通じて、少ない資金で大規模なAIモデルを模倣できるのであれば、AIモデルの商業的成功に疑問が生じる可能性があると指摘している。

すでにオープンAIは、ディープシークが蒸留技術を用いて自社のAIモデルのデータを不適切に取り入れたと批判している。

一方、マイクロソフト(MS)、アルファベット、アマゾン、メタといった大手クラウド企業のビッグ4は、今年も引き続きAIへの大規模な投資を計画している。MSは800億ドル(約12兆1,580億円)、アルファベットは750億ドル(約11兆3,981億円)、アマゾンは1,050億ドル(約15兆9,574億円)を投資予定であり、メタは600億ドル(約9兆1,215億円)~650億ドル(約9兆8,816億円)を計画している。

関連記事

コメントを書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください