AI（人工知能） 2021.02.01 2022.10.15 cedro

StyleGAN2で、アニメキャラの上半身を生成する

1.はじめに

　通常、GANでアニメキャラを生成するというと顔のみです。しかし、今回ご紹介するのは、なんとアニメキャラの上半身を生成するGANです。

2.手法

　先週、AIアーティストAydaoさん(@AydaoAI)が作成したGANモデルを使った、This Anime Does Not Exist というHPが公開されました。このHPでは、GANを使って、この世界に存在しないアニメキャラクターを生成することが出来ます。

　HPを開くと、この様に画面一杯にアニメキャラクターがスクロールする形で生成されます。そして、生成するときの創造性(Creativity)と画面のスクロール速度(Speed)をスライダーで設定出来ます。

　GANをちょっとでも触ってみた人であれば、顔だけでなく上半身を画像生成することがどれほど大変なことか直ぐ分かると思います。Aydaoさんは、これを STyleGAN２を使い、膨大な学習データと転移学習・拡張によって実現しています。凄い！!！

　Aydaoさんの作ったモデルの学習済みの重みは公開されていますので、今回はそれを元に Google Colab でAydaoワールドを覗いてみたいと思います。

3.コード

　コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。

　最初に、tensorflow1.15.0 を動かすために必要な cuda10.0 をインストールします（2022.10よりgoogle colab からcuda10.0が削除されたため）。

#@title install cuda10.0 

# download data
!wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
!sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
!rm /etc/apt/sources.list.d/cuda.list
!sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
!sudo apt-get update
!wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
!sudo apt install -y ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
!sudo apt-get update

# install NVIDIA driver
!sudo apt-get -y installnvidia-driver-418

# install cuda10.0
!sudo apt-get install -y \
    cuda-10-0 \
    libcudnn7=7.6.2.24-1+cuda10.0  \
    libcudnn7-dev=7.6.2.24-1+cuda10.0

# install TensorRT
!sudo apt-get install -y libnvinfer5=5.1.5-1+cuda10.0 \
    libnvinfer-dev=5.1.5-1+cuda10.0

!apt --fix-broken install

#@title install cuda10.0

# download data

!wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb

!sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb

!rm /etc/apt/sources.list.d/cuda.list

!sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub

!sudo apt-get update

!wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb

!sudo apt install -y ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb

!sudo apt-get update

# install NVIDIA driver

!sudo apt-get -y installnvidia-driver-418

# install cuda10.0

!sudo apt-get install -y \

cuda-10-0 \

libcudnn7=7.6.2.24-1+cuda10.0 \

libcudnn7-dev=7.6.2.24-1+cuda10.0

# install TensorRT

!sudo apt-get install -y libnvinfer5=5.1.5-1+cuda10.0 \

libnvinfer-dev=5.1.5-1+cuda10.0

!apt --fix-broken install

　まず、セットアップを行います。

# github からコードをコピー
!git clone https://github.com/cedro3/stylegan2.git

1 2	# github からコードをコピー !git clone https://github.com/cedro3/stylegan2.git

# 学習済みの重みのダウンロード
import gdown
gdown.download('https://drive.google.com/u/1/uc?id=1_NUX9_xRGjce1KbCxT4frUsFWctlN4ZC', 'network-tadne.pkl', quiet=False)

# 学習済みの重みのダウンロード

import gdown

gdown.download('https://drive.google.com/u/1/uc?id=1_NUX9_xRGjce1KbCxT4frUsFWctlN4ZC', 'network-tadne.pkl', quiet=False)

# TensorFlow_plugin セッティングと関数定義
!pip install tensorflow==1.15.0
!pip install imageio==2.4.1
%cd /content/stylegan2
from function import *

# TensorFlow_plugin セッティングと関数定義

!pip install tensorflow==1.15.0

!pip install imageio==2.4.1

%cd /content/stylegan2

from function import *

　次に、seedで指定した2枚の画像をブレンドした画像を生成してみましょう。seed は整数であれば何でもかまいません。

　blending = 0.5 はブレンドするときの src_seed の比率です。 truncation_psi = 0.8 は画像を生成するときに学習画像からどれだけ離すか（創造的か）の設定です。

# seedで指定した2枚の画像をブレンドした画像を生成する
src_seed =  6677  
dst_seed =  7561  
blending = 0.5 
truncation_psi = 0.8 
generate_images([src_seed, dst_seed], truncation_psi)

print("Blended image (", blending, ")")
blend_images(src_seed, dst_seed, blending=blending, truncation_psi=truncation_psi)

# seedで指定した2枚の画像をブレンドした画像を生成する

src_seed = 6677

dst_seed = 7561

blending = 0.5

truncation_psi = 0.8

generate_images([src_seed, dst_seed], truncation_psi)

print("Blended image (", blending, ")")

blend_images(src_seed, dst_seed, blending=blending, truncation_psi=truncation_psi)

　「清楚なお嬢さん」と「ワイルドなお姉さん」を50:50でブレンドすると、「ワイルドなお嬢さん」が出来上がります。

　次に、seedで指定した2枚の画像をモーフィングする動画を生成してみます。duration_sec ＝ 5.0 はモーフィング時間(sec)、mp4_fps = 20 は動画のフレームレートです。

# seedで指定した2枚の画像をモーフィングする動画を生成する 
src_seed =  5126
dst_seed =  5805
truncation_psi = 0.7 
duration_sec = 5.0 
mp4_fps = 20

generate_images([src_seed, dst_seed], truncation_psi)
output_filename = interpolate_between_seeds(seed_array=[src_seed, dst_seed], truncation=truncation_psi, duration_sec=duration_sec, mp4_fps=mp4_fps)

# seedで指定した2枚の画像をモーフィングする動画を生成する

src_seed = 5126

dst_seed = 5805

truncation_psi = 0.7

duration_sec = 5.0

mp4_fps = 20

generate_images([src_seed, dst_seed], truncation_psi)

output_filename = interpolate_between_seeds(seed_array=[src_seed, dst_seed], truncation=truncation_psi, duration_sec=duration_sec, mp4_fps=mp4_fps)

# 生成した動画を再生する
display_mp4(output_filename)

1 2	# 生成した動画を再生する display_mp4(output_filename)

　2枚の画像の完成度が高いだけでなく、その中間画像も連続的で綺麗なことが分かります。

　最後に、創造性に関係する truncation_psi をもっと大きく（最大2.0）して、ランダムにグリッドでモーフィングする画像を生成してみましょう。ここで、random_seed は乱数の系列を表します。

　grid_width = 2 はグリッドの横の大きさ、grid_height = 2はグリッドの高さの設定です。 (ちなみに、grid_width = 1, grid_height = 1 だと動画を1つだけ生成します）

# ランダムにグリッドでモーフィング画像を生成する 
random_seed = 822  
duration_sec = 5 
mp4_fps = 30 
grid_width =  2
grid_height =  2

output_filename = make_video(grid_size=[grid_width,grid_height], duration_sec=duration_sec, mp4_fps=mp4_fps, random_seed=random_seed)

# ランダムにグリッドでモーフィング画像を生成する

random_seed = 822

duration_sec = 5

mp4_fps = 30

grid_width = 2

grid_height = 2

output_filename = make_video(grid_size=[grid_width,grid_height], duration_sec=duration_sec, mp4_fps=mp4_fps, random_seed=random_seed)

# 生成した動画を再生する
display_mp4(output_filename)

1 2	# 生成した動画を再生する display_mp4(output_filename)

　モーフィングの途中でtruncation_psi を大きくしているので、より創造的な（変化の大きい）画像が生成されていることが分かります。また、学習データの中には、漫画のコマ割りの様なデータも含まれているようです。random_seed の数字を色々変えて楽しんでみて下さい。

　それにしても、Aydao ワールド、魅力的過ぎます。もう現実に戻って来れないかも。。。。

　では、また。

twitterへの投稿

ブログを書きました！

　今回ご紹介するのは@AydaoAIさんが作ったディープラーニングでアニメ画像を生成するモデルです。
　この動画は、そのモデルを使って、この世界に存在しないアニメ画像を生成しモーフィングを掛けたもので、後半は変化を大きくしています。

ブログ：https://t.co/FWkEPested pic.twitter.com/QeMyoXIdpV
— cedro (@jun40vn) February 1, 2021

通常、GANでアニメを生成すると言えば顔だけですが、これはStyleGAN２でアニメの上半身を生成するモデルです。

作成したのは、AIアーティストAydao（@AydaoAI）さんで、膨大なアニメ画像を使った転移学習・拡張によってアニメの上半身の生成を可能にしています。

ブログ：https://t.co/FWkEPeK4CN pic.twitter.com/ctB5ROapp4
— cedro (@jun40vn) March 15, 2022

12 件のコメント

任意の画像をアップロードし読み込ませることは可能でしょうか。
二次元三次元問わず、任意の画像をアップロードしモーフィングさせる方法をご存じでしたらお教えいただけますと幸いです。

StyleGAN2で、アニメキャラの上半身を生成する

1.はじめに

2.手法

3.コード

12 件のコメント

コメントを残すコメントをキャンセル

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

Animate Anyoneで、１枚の画像から動画を生成する

SVDで静止画から動画を生成する

DiffMorpherを使って、拡散モデルでモーフィングを行う

Domo AIで、実写動画をアニメ化する

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

1.はじめに

2.手法

3.コード

12 件のコメント

コメントを残す コメントをキャンセル

RECOMMENDこちらの記事も人気です。

Hyperstyleで、高精度で編集しやすい反転を高速に行う

DiffMorpherを使って、拡散モデルでモーフィングを行う

SONY Neural Network Consoleで日経平均株価をデ…

Stable Diffusionによる動画生成をGoogle Colab…

Keras CNN を改造してImageDataGenerator（画像…

DCT-Net によるポートレートのスタイル転送

Live Speech Portraits で音声から顔画像を動かす

CLIPを使って、大量の画像の中から自分が探したい画像をテキストで検索する

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

Animate Anyoneで、１枚の画像から動画を生成する

SVDで静止画から動画を生成する

DiffMorpherを使って、拡散モデルでモーフィングを行う

Domo AIで、実写動画をアニメ化する

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

コメントを残すコメントをキャンセル

Stable　Diffusionによる動画生成をGoogle Colab…