文章から画像を生成するAI、DALL-E2

2021年のことだったと思う。あのイーロンマスクが設立したAIの非営利団体、OpenAI。そこが文章から絵を生成する人工知能DALL-Eを開発したと発表。実験に参加する人を募集してたので応募した。長い待ち行列に追加されたようでなかなか招待が来ない。すっかり忘れていたら

招待状が届いた

これが届いた招待状のメール、どこにもURLとか書いてないんだけど、どこへ行ったらいいんだか。あれこれネットをさまよっていると、同じく招待状が届いた人のメール画像を発見。実はこの赤丸の部分にリンクがついたボタンがあったのでした。どうして表示されないのか、でも、たしかにボタンがある。

DALL-E2にログオン

応募したときはDALL-Eだったけど、その間にバージョンアップしてDALL-E2になっていた。生成する絵の詳細さもアップした模様。さっそくなにか文章を入れてみる。何がいいかなぁ、やっぱりあり得ないものがいいよね。文章は英文で入れないといけないから、DeepLを使ってこんな日本語を入れてみた。

月面のクレーターでそり遊びをする

これを英文に翻訳すると、

Sledding in a lunar crater

待つこと十数秒、あっという間に6枚の絵が生成される。これがそのうち一番気に入った1枚。確かに向こうに見えるのは地球らしく、手前の坂はクレーターの斜面みたいだし、そり遊びをしている何か?がある。面白いねぇ。

DALL·E 2022-07-12 02.30.10 – Sledding in a lunar crater2

猫の絵で攻める

前の遊んでいる部分、なんだかよくわからない。猫で何か描かせてみよう。

浜辺で缶ビールで乾杯する猫たち

Cats toasting with beer cans on the beach

DALL·E 2022-07-12 02.32.03 – Cats toasting with beer cans on the beach

宇宙飛行士になった黒猫が月面探査をする

Black Cat as Astronaut Explores the Moon’s Surface

DALL·E 2022-07-12 02.39.15 – Black Cat as Astronaut Explores the Moon’s Surface

2匹の猫が浜辺で卓球で遊んでいる

Two cats playing ping-pong on the beach.

DALL·E 2022-07-12 09.27.13 – Two cats playing ping-pong on the beach.

摩天楼の屋上でヨガをする3匹の猫

Three cats doing yoga on the roof of a skyscraper

DALL·E 2022-07-12 09.31.28 – Three cats doing yoga on the roof of a skyscraper

このヨガの絵が一番気に入ってる。すごいなDALL-E2!

絵の一部を差し替えてみる

元の画像の一部を消して、そこに文章で書いた絵をなじませて描くこともできる。例えば、この車の写真。アップロードして車のところをエディタで消す。そして「猫が運転する赤いオープンカー」「Red convertible driven by a cat」と指定してみる。アップロードした画像は正方形に切り取らないといけないから、左側に合わせてみた。もっと効果的な例のほうが面白かったか。それに猫の顔がちょっと崩れている。

元の画像、車の部分を差し替えてみる
車の部分が差し替わっている

現在は人間の顔などセンシティブなものをアップして差し替えようとしても出来ないようになっている。そりゃフェイク画像がいくらでも作れそうですからね。

興味があったら試してみてください。ここがその入口です。ただし、順番リストに入っても、いつ招待状が届くかわかりません。数ヶ月の覚悟は必要かも。