グーグルはテキストを入力するとイメージを生成する生成系人工知能(AI)サービスの最新バージョンを発表した。
18日、情報技術(IT)業界によると、グーグルは15日に「イマジェン(imagen)3」をアメリカで発売した。イマジェン3は、昨年12月の発売以来、8ヶ月ぶりのアップグレード版である。利用者が複雑な技術なしに、自然な言語で望んでいる画像について説明をするだけで、それに合った画像が生成される。特定の構図や長い説明などの細かい要求も反映することができる。
グーグルディープマインドは、このモデルに関する研究論文を共有し、「『テキスト・トゥ・イメージ(text-to-image)』生成のためには最高性能のモデル」として、「前のモデルよりもはるかに細かく、豊かな照明効果を持つ画像を生成することができ、不要な要素などは大幅に減らした」と説明した。
画像生成の悪用を防ぐために、安全装置も整えられた。生成された画像にはデジタルウォーターマークが表示され、有名人の画像は生成されない。
イマジェン3はアメリカでグーグルの生成AIプラットフォームであるイマジェンFXと、企業向けAIプラットフォームであるバーテックスAI(Vertex AI)で利用することができる。