人間とAIを比較して、

「創造性は人間だからこそ持てる」

と一般的には言われていると思いますが、

そうでもないかも、と感じたのが

Googleが開発した「テキストだけで画像を作ることのできるAI(Imagen)」です。

 

Googleが開発したAI「Imagen」

Imagenは、Googleが開発した

ハイレベルのフォトリアリズム(写真を克明に描写する方法のこと)を達成でき、かつ

深い言語理解ができるAIです。

公式サイト:Imagen: Text-to-Image Diffusion Models

この開発を行うにあたって、事前に学習した大規模な言語モデルと

画像を合成するためのテキスト変換がマッチングしたようです。

画像生成モデルのベンチマーク(「DrawBench」)をとっても、

Alignment(画像の自然さ)、Fidelity(テキスト忠実度)で高い評価を得ています。

 

実際の絵がリアルすぎる

実際にテキストから合成された画像をみてみると、

リアルすぎてびっくりします。

A chrome-plated duck with a golden beak arguing with an angry turtle in a forest.

(森の中で怒った亀と口論する金色のくちばしを持つクロムメッキのアヒル)

確かにアヒルはクロムメッキだし、「怒った亀」もきちんと描写されています。

 

Sprouts in the shape of text ‘Imagen’ coming out of a fairytale book.

(おとぎ話の本から出てくる文字「イマジン」をかたどった新芽。)

これとか、イラストレーターさんが作った画像みたいですよね。

「おとぎ話」というテキストからこんな描写ができるなんて。

 

A robot couple fine dining with Eiffel Tower in the background.

(エッフェル塔を背景に食事をするロボットカップル。)

なんだか、AIを開発する会社の広告のようです。右が女性ロボットというのがわかります。

カップルが食事、ということでワインなのかな。

テーブルクロスつけておしゃれ。

 

A cute corgi lives in a house made out of sushi.

(お寿司でできた家に、かわいいコーギーが住んでいます。)

最後に、「かわいい!」と思った一枚を笑。

「かわいくないコーギー」って書いたらどうなるんだろう、とか。

 

「AIには創造性はない」と言えるか

なんだかここまでくると

「AIには創造性はない」と言えるか、

自信がなくなってきます。

人間には思い付かないような、

「そうきたか!」という描写ができるのかな、と。

 

ただ、やはり「倫理性」については課題があるとのことで、

一般公開は今のところされないようです。

ステレオタイプ、軽蔑的、差別的、ポルノ画像、有害コンテンツなど

が懸念されているようです。

 

確かに、こういったものを悪用して

有害なものを作って販売する人間もいそうですよね。

 

いずれにしても、

AIの進化は私の想像を遥かに超えていて、

人間にしかないはずの創造性すらも

揺るがしているんだな、

という驚きでした。

 

他にも色んな画像がテキストから作られていて面白いので、

是非ご覧ください。

Imagen: Text-to-Image Diffusion Models

 

編集後記

週末は、実家で家族とみんなでのんびりPIZZAを。

たまには美味しい。

 

最近のあたらしいこと

Uni Coffeeのコーヒー豆

« »