
ロボットにオレンジ色の折り紙を渡すと、ロボットは待っていたかのように角を合わせて紙を折り始める。瞬く間にロボットはキツネの形の折り紙を完成させる。折り紙をしている間、ロボットはユーザーに折り紙という言葉の語源を説明することもある。
12日(現地時間)、グーグルが公開した自社のヒューマノイドロボット用AI(人工知能)モデルを搭載したロボットだ。人間と絶え間なくコミュニケーションを取り、人の指のように自由に動かせる器用さが特徴だ。特定の目的を持つロボットではなく、どこでも使える「汎用ロボット」を目指した。
「物理的世界にAIを導入する」

グーグルのAI研究組織ディープマインドは同日、ロボット用AIモデル「Gemini Robotics 」と「Gemini Robotics ER(Gemini Robotics-ER)」を発表した。両モデルとも、グーグルの最新AIモデル「Gemini 2.0(Gemini 2.0)」を活用し、ヒューマノイドロボットが様々な環境で迅速に対応できるよう設計された。両モデルの違いは、通常のGemini Roboticsモデルが物理的動作の制御に焦点を当てた視覚・言語・行動(VLA)モデルであるのに対し、Gemini Robotics ERは内在的推論(ER)技術を活用してロボットが自律的に行動できるよう支援することに重点を置いている点だ。
実際、この日グーグルが公開したデモ動画では、Gemini Roboticsを搭載したロボットが様々な状況で人間のように振る舞う様子が見られた。折り紙以外にも、小さなおもちゃのバスケットボールコートでダンクシュートをするよう指示すると、小さなボールを拾い上げてゴールに入れた。指示に従って目の前に置かれた複数のアルファベットが書かれたブロックを綴り順に並べたり、ビニール袋にサンドイッチを入れた後、ジッパーを閉めたりもした。
グーグルは自社モデルの「汎用性」を強調した。グーグルディープマインドのエンジニアであるカニシュカ・ラオ氏は、「人々に役立つロボットAIモデルは、様々な状況に適応できるよう汎用的でなければならない」と述べ、「さらに、人間と相互に作用し、人間が通常手や指で行う作業を器用にこなせる必要がある」と語った。そして「Gemini Roboticsは真の『汎用ロボット』への一歩を踏み出すものだ」と付け加えた。
熱を帯びるヒューマノイドロボット市場競争

グーグルは汎用性を前面に押し出し、近年、競争が一層激しくなっているヒューマノイドロボット用AI市場を先取りする計画だ。ロボットの身体となるハードウェア開発では、アメリカのヒューマノイドロボット企業アプトロニック(Apptronik)と提携している。
グーグルは先月、アプトロニックへの3億5,000万ドル(約520億4,133万9,693円)規模の新規投資に共同参加した。この日、グーグルはGemini Roboticsをアプトロニックのロボットに搭載し、ロボットの様々な動作をデモンストレーションした。
市場調査会社のマーケッツ・アンド・マーケッツによると、昨年20億3,000万ドル(約3,018億3,977万円)だったヒューマノイドロボット市場は、2029年には132億5,000万ドル(約1兆9,698億397万円)まで約6倍に拡大する見込みだ。
テスラは自社のヒューマノイドロボット「オプティマス(Optimus)」を年内に電気自動車生産ラインに投入する計画を発表し、エヌビディアは先月、ロボット仮想訓練プラットフォーム「コスモス(Cosmos)」を発表した。オープンAIとメタは最近、ロボット専門人材を多数採用し、ロボット用AI開発に注力している。