Stable Diffusionによる画像生成をGoogle Colabでやってみる

1.はじめに

 ディープラーニングによる文による画像生成技術が一般化するフェーズに入りました。

 今年4月にOpenAIはDALL-E2が驚異的な画像生成能力を実現したとアナウンスしましたが、テスト版を試せる人はかなり限られていました。そうした中、Midjourney研究所が7月からMidjourney(ミッドジャーニー)というサブスク・サービスを開始したことが火付け役となって現在世間の注目を集めています。

 そして、昨日(8/23)イギリスのスタートアップ企業Stability AIがMidjourneyよりレベルアップを図ったStable Diffusionを無料公開しました。今回は、この無料公開されたものをGoogle Colabで実際に動かしてみます。

2.アクセス・トークンの取得

 文による画像生成技術に必要な学習済みパラメータは数Gバイトと巨大なため、配布にはそれなりのサーバーが必要です。今回、そのサーバーはディープラーニングコミュニティHugging Faceが使用しているサーバーを流用します。そのため、Hugging Faceにアカウントを作り、使用申請し、アクセス・トークンというダウンロードするときに使用するパスワードを取得します。

 まず、Hugging Face のアカウントを作成する必要があります。このリンクでホームページに飛び、「Sign UP」をクリックして所定の内容を記入し、返信メールのリンクをクリックして、アカウントを作成します。

 

 次に、今回使用するModel card(学習済みパラーメータをこう呼んでいます)の使用申請をします。このリンクをクリックして表示されたページの「I have read the Licence and agree with its terms」のチェックボックスにチェックを入れ、「Access repository」をクリックします。

 

 そして、Model cardへアクセスするためのAccess Tokenを取得します。このリンクをクリックして表示されたページで「New token」をクリックします。この後、Nameを入力しますが、適当な名前でOKです。

 

 最終的に下記のようにAccess Token が取得できます。赤枠のところをクリックすると、Access Tokenがコピーされます。これを次のコードを動かすときに使用します。

3.コード

 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。

 まず、セットアップを最初に1回だけ行います。Access_Tokenに先程取得したものをコピーし、実行します。

  

  それでは、文から画像生成してみましょう。promptに英文を記入し、画像を生成します。ここでは、「An astronaut riding a horse in a photorealistic style」と入力し、実行します。

 生成した画像は、An_astronaut_riding_a_horse_in_a_photorealistic_style.pngというファイル名で保存されます。

 下記を実行すると作成した画像がダウンロードされます(Google Chrome専用です)。

 いやー、凄い勢いでディープラーニング技術が一般化して行きます!これは面白い時代になりましたね。

 では、また。

リンク

とりあえずどんなものか動かしてみたい場合は、下記もどうぞ

Dream Studio: https://beta.dreamstudio.ai/dream

Hugging Face: https://huggingface.co/spaces/stabilityai/stable-diffusion

2 件のコメント

  • すいません質問ですが、リンクにあるHugging Faceの「Access repository」のボタンがない状態なのですが、
    この方法で使うことは現在不可能になっているのでしょうか?

    • jjj10goldさん
      Hugging Faceの「Access repository」のボタンが表示されていなければ、使用申請OKの状態ですので、次のステップへ行って下さい。

  • teru へ返信する コメントをキャンセル

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

    日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

    ABOUTこの記事をかいた人

    アバター

    ディープラーニング・エンジニアを趣味でやってます。E資格ホルダー。 好きなものは、膨大な凡ショットから生まれる奇跡の1枚、右肩上がりのワクワク感、暑い国の新たな価値観、何もしない南の島、コード通りに動くチップ、完璧なハーモニー、仲間とのバンド演奏、数えきれない流れ星。