数ヶ月前から話題になっている、

テキストから画像を生成するAI『Stable Diffusion』を試してみました。

自分が任意のテキストを打ち込むと、それに合った画像を自動生成してくれる

AIサービスです。

 

使い方と、色々試してみたことを書きます。

※ピカソ風の日本画

 

Stable Diffusionとは

Stable diffusionとは、2022年8月に無償で公開された

テキストから自動的に画像を生成するAIです。

アカウントを作れば、誰でも利用できます。

 

イギリスのスタートアップ・Stability AIという会社が開発したようです。

 

こちらのデモサイトでも簡単に利用できますが、

専用のWebサービス「Dream Studio」を使うと

より凝った使い方ができそうだったので、

こちらを試してみました。

 

画像の作り方

まずは、以下のページでDream Studioの

アカウントを作成します。

Log in | StabilityAI

 

アカウントを作ると、次の画面となります。

下のテキストボックスがテキスト入力部分で、右側が画像の詳細(サイズ、マッチ度、画像数など)

を設定する部分です。

「Dream」ボタンで画像が生成されます。

 

まず試しに、「dog」と一言入れて生成してみました。

(なお、日本語ではうまくいかないので英語で入力する必要があります。)

おおっ。。。なんか奥ゆかしい感じのわんちゃんが生成されました。

 

これだけでも面白いですが、

一つの単語だとそこまで面白い画像ができないので「Prompt Guide」

でより詳しく画像生成方法を確認しました。

 

より詳しい画像生成方法

スタイル

生成したい画像のスタイルを単語で指定することができます。

例えば、

  • Realistic(写実風)
  • Oil painting(油絵風)
  • Pencil drawing(鉛筆画風)
  • Concept art(雰囲気がある風)

といった感じです。

 

アーティスト

なんと、アーティストを指定するとそのアーティスト風の画像を生成することができます。

Guideでは、以下が紹介されていました。

例えば、

  • ピカソ
  • セザンヌ
  • ゴッホ
  • レオナルド・ダ・ヴィンチ
  • ミケランジェロ

なんかです。

好きなアーティストを追加すれば、

より好みの画像になること間違いなしです。

 

その他、画像のタッチ(高精緻, シュールレアリズム, 三原色使い, 滑らか, シャープ, マット, エレガントなど)などを指定できます。

 

生成してみた画像

以上を踏まえて、

最近好きな月夜に照らされる日本のお寺をモチーフにした画像を生成してみました。

 

指定した単語:Japanese temple, moonlight night, Picasso, realistic, colorful

 

月夜に照らされるお寺をピカソ風に、写実風に、カラフルに生成してみました。

おっきな月は良い感じですが、ピカソにしては遊び心がないような・・。

 

次はレオナルド・ダ・ヴィンチ、油絵風。

指定した単語:Japanese temple, moonlight night, Leonardo DaVinci, oil painting

 

雰囲気に合った、渋い感じの画像ができました!

ポストカードにも使えそう。

 

次は、セザンヌ。

指定した単語:Japanese temple, moonlight night, Paul Cezanne, oil painting

 

うん、セザンヌっぽいぼやっとして子供が描いた絵っぽい雰囲気が

良い感じ。

 

ちなみに、アーティストは日本人でもできました。

 

例えば、女の子、鳥山明さんという単語を指定してみると、

ドラゴンボールに出てきそうなキャラクターが。

(雲、足の書き方とか、モロですね・・。)

 

指定した単語:Girl, Toriyama akira

他の作家さんも色々試すと面白そうです!

 

注意点

生成された画像はパブリックドメイン

自分で生成した画像はパブリックドメイン(著作権が発生していない状態)になると

明記されています。

したがって、許可を得ずに複製、変更を加えることができます。

 

ただ、先ほどの鳥山明さん風の画像でもみた通り、

明らかに類似する画風の場合問題になる可能性が高いでしょう。

 

コストが発生する

このサービスは完全無料ではなくて、

生成する画像数、画像の解像度や枚数によってコストが発生します。

出典:DreamStudio FAQ

 

なお、アカウント登録時にクレジットが自動的に2ポンド付与されています。

クレジット残高はマイページから確認できます。

今回、30枚くらい画像作成して使用クレジットは0.32ポンドでしたので、コストは発生しませんでした。

試す分には十分だと思います。

 

まとめ

テキストからAI画像生成する『Stable Diffusion』を試してみましたので、

始め方と体験談を書いてみました。

 

著作権は考慮しつつ、

ちょっとしたデザインに使えそうです。

 

一応数年前に「G検定」(ディープラーニング検定)の資格をとっていて、

この分野にはとても惹かれるものがあります。

(もう、ほとんど忘れちゃったけど・・)

 

AIの自動画像生成に興味がある人は是非お試しください。

 

編集後記

昨日は、山梨→横浜へ帰宅、仕事。

特急車の中でお弁当を食べて、満足。

 

最近のあたらしいこと

YATSUDOKI 純正クリームどら焼き

« »