ホーム ニュース IT・テック ChatGPTを震撼させた中国製AI、その裏側にいる「20代の天才たち」

ChatGPTを震撼させた中国製AI、その裏側にいる「20代の天才たち」

0
引用:X(旧Twitter)のキャプチャ画像
引用:X(旧Twitter)のキャプチャ画像

中国のAIスタートアップ、ディープシーク(DeepSeek)が先月20日に圧倒的な低コストで高性能な推論モデル「R1」を発表し、世界中のIT業界に衝撃を与えた。この中で、ディープシークの躍進を牽引した「中国の若き天才たち」に注目が集まっている。

2日(現地時間)、香港紙「サウス・チャイナ・モーニング・ポスト(SCMP)」などによると、ディープシークが最近発表したAIモデル「ディープシーク V3」は、同社創業者の梁文鋒を含む中国人研究者・エンジニア150名とデータ自動化研究チーム31名によって開発された。

昨年12月に発表された大規模言語モデル(LLM)「V3」の公開からわずか1ヶ月余りで発表されたR1は、V3とともにOpenAIのChatGPT、MetaのLlama、AnthropicのClaudeなど、米国の主要AIモデルと同等かそれ以上の性能を持つとされる。

驚くべきは、V3の訓練にかかった費用が557万6,000ドル(約8億6,591万円)という点だ。これはMetaがLlama 3モデルをNVIDIAの高価なチップH100で訓練した費用の10分の1程度にすぎない。

NVIDIAの比較的安価なチップ「H800」を1時間2ドル(約310円)で2ヶ月間借りた費用を計算したもので、人件費や運営費などは含まれていない。しかし、安価なリソースで優れた性能のモデルを作り出したことで、米国株式市場ではAI関連銘柄が動揺した。

シリコンバレーの大手テック企業を震撼させたディープシークの研究者たちは20代から30代前半が中心で、その多くが海外留学経験のない中国の名門大学を卒業した本土出身だという。創業者の梁文鋒とともに最も注目を集めているのが、1995年生まれの開発者、羅富麗だ。四川省の農村出身の羅は、電気技師の父と教師の母のもとで育った。両親が地元の大学への進学を勧めたにもかかわらず、羅は「大都市に行くべきだ」と主張し、北京師範大学の電子工学科に入学したという。彼女は、大学1年を終える頃、「電子工学科よりもコンピュータ学科の将来性が高い」という教授のアドバイスに従い、コンピュータ学科に転科。学部卒業後は北京大学でコンピュータ言語学の修士号を取得した。

「AI界の天才」として認められた羅は、先月シャオミからスカウトの誘いを受けた。シャオミ創業者の雷軍レイ・ジュンは、羅に年俸1,000万元(約2億1,587万円)を提示したが、業界では彼女が起業すればさらに多くの資金を調達できるとみており、シャオミの提案を受け入れない可能性が高いとされている。梁文鋒も羅と同じく中国国内で教育を受けた人材だ。1985年生まれの広東省出身、工学分野で名高い浙江大学で電子情報工学を専攻し、学士と修士の学位を取得している。

ディープシークのAIモデルの推論効率を高めた学習アーキテクチャ「マルチヘッド潜在アテンション(MLA)」研究の中心人物とされる高華佐と曽万丁も中国本土出身だ。高華佐は北京大学で物理学の学位を取得し、曽万丁は2021年から北京郵電大学のAI研究所で修士課程に在籍している。他の主要メンバーには、中山大学で博士号を取得した郭大亜、北京大学で博士号を取得した朱啓豪と戴大邁などがいる。

これに関連してSCMPは「多くの中国AIスタートアップが業界で認められた研究者や海外で博士号を取得した留学組を好む傾向にあるのに対し、ディープシークは国内派が中心となっている。これは人材に対するディープシークのアプローチが独特であることを示している」と指摘している。

コメントなし

コメントを書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

モバイルバージョンを終了