テキストから画像生成するAI『Stable Diffusion』を試してみた

2022.10.05
Webサービス

Pocket

数ヶ月前から話題になっている、

テキストから画像を生成するAI『Stable Diffusion』を試してみました。

自分が任意のテキストを打ち込むと、それに合った画像を自動生成してくれる

AIサービスです。

使い方と、色々試してみたことを書きます。

※ピカソ風の日本画

1. Stable Diffusionとは
2. 画像の作り方
3. より詳しい画像生成方法
- 3.1. スタイル
- 3.2. アーティスト
4. 生成してみた画像
5. 注意点
- 5.1. 生成された画像はパブリックドメイン
- 5.2. コストが発生する
6. まとめ
7. 編集後記
8. 最近のあたらしいこと
- - 8.2.1. メニュー
  - 8.2.2. メディア

Stable Diffusionとは

Stable diffusionとは、2022年8月に無償で公開された

テキストから自動的に画像を生成するAIです。

アカウントを作れば、誰でも利用できます。

イギリスのスタートアップ・Stability AIという会社が開発したようです。

こちらのデモサイトでも簡単に利用できますが、

専用のWebサービス「Dream Studio」を使うと

より凝った使い方ができそうだったので、

こちらを試してみました。

画像の作り方

まずは、以下のページでDream Studioの

アカウントを作成します。

アカウントを作ると、次の画面となります。

下のテキストボックスがテキスト入力部分で、右側が画像の詳細（サイズ、マッチ度、画像数など）

を設定する部分です。

「Dream」ボタンで画像が生成されます。

まず試しに、「dog」と一言入れて生成してみました。

（なお、日本語ではうまくいかないので英語で入力する必要があります。）

おおっ。。。なんか奥ゆかしい感じのわんちゃんが生成されました。

これだけでも面白いですが、

一つの単語だとそこまで面白い画像ができないので「Prompt Guide」

でより詳しく画像生成方法を確認しました。

より詳しい画像生成方法

スタイル

生成したい画像のスタイルを単語で指定することができます。

例えば、

Realistic（写実風）
Oil painting（油絵風）
Pencil drawing（鉛筆画風）
Concept art（雰囲気がある風）

といった感じです。

アーティスト

なんと、アーティストを指定するとそのアーティスト風の画像を生成することができます。

Guideでは、以下が紹介されていました。

例えば、

ピカソ
セザンヌ
ゴッホ
レオナルド・ダ・ヴィンチ
ミケランジェロ

なんかです。

好きなアーティストを追加すれば、

より好みの画像になること間違いなしです。

その他、画像のタッチ（高精緻, シュールレアリズム, 三原色使い, 滑らか, シャープ, マット, エレガントなど）などを指定できます。

生成してみた画像

以上を踏まえて、

最近好きな月夜に照らされる日本のお寺をモチーフにした画像を生成してみました。

指定した単語：Japanese temple, moonlight night, Picasso, realistic, colorful

月夜に照らされるお寺をピカソ風に、写実風に、カラフルに生成してみました。

おっきな月は良い感じですが、ピカソにしては遊び心がないような・・。

次はレオナルド・ダ・ヴィンチ、油絵風。

指定した単語：Japanese temple, moonlight night, Leonardo DaVinci, oil painting

雰囲気に合った、渋い感じの画像ができました！

ポストカードにも使えそう。

次は、セザンヌ。

指定した単語：Japanese temple, moonlight night, Paul Cezanne, oil painting

うん、セザンヌっぽいぼやっとして子供が描いた絵っぽい雰囲気が

良い感じ。

ちなみに、アーティストは日本人でもできました。

例えば、女の子、鳥山明さんという単語を指定してみると、

ドラゴンボールに出てきそうなキャラクターが。

（雲、足の書き方とか、モロですね・・。）

指定した単語：Girl, Toriyama akira

他の作家さんも色々試すと面白そうです！

注意点

生成された画像はパブリックドメイン

自分で生成した画像はパブリックドメイン（著作権が発生していない状態）になると

明記されています。

したがって、許可を得ずに複製、変更を加えることができます。

ただ、先ほどの鳥山明さん風の画像でもみた通り、

明らかに類似する画風の場合問題になる可能性が高いでしょう。

コストが発生する

このサービスは完全無料ではなくて、

生成する画像数、画像の解像度や枚数によってコストが発生します。

出典：DreamStudio FAQ

なお、アカウント登録時にクレジットが自動的に2ポンド付与されています。

クレジット残高はマイページから確認できます。

今回、30枚くらい画像作成して使用クレジットは0.32ポンドでしたので、コストは発生しませんでした。

試す分には十分だと思います。

まとめ

テキストからAI画像生成する『Stable Diffusion』を試してみましたので、

始め方と体験談を書いてみました。

著作権は考慮しつつ、

ちょっとしたデザインに使えそうです。

一応数年前に「G検定」（ディープラーニング検定）の資格をとっていて、

この分野にはとても惹かれるものがあります。

（もう、ほとんど忘れちゃったけど・・）

AIの自動画像生成に興味がある人は是非お試しください。

編集後記

昨日は、山梨→横浜へ帰宅、仕事。

特急車の中でお弁当を食べて、満足。

最近のあたらしいこと

YATSUDOKI 純正クリームどら焼き

前の記事

「毎月プチ旅に行く」ためにしていること 2022.10.04
次の記事

手作り味噌のススメ、作り方。もう普通の味噌に戻れない気がする 2022.10.06