Keras で変分オートエンコーダ（VAE）をMNISTでやってみる

今回は、変分オートエンコーダ（VAE）のサンプルプログラムで遊んでみます。

こんにちは cedroです。

変分オートエンコーダ（Variational Auto Encoder = VAE ）をご存知ですか。

普通のオートエンコーダは、入力Xを潜在変数Zに次元圧縮することによって特徴量を学習するニューラルネットワークです。MNISTを例にとれば、学習を完了すると、ある数字Xを入力すると同じ形の数字X’を出力します。

一方、変分オートエンコーダーは、潜在変数Zが正規分布に従うように学習させることで、オートエンコーダと同様なことを実現するだけでなく、潜在変数Zを直接操作することで生成出力X’をコントロールすることができます。

ということで、今回は、変分オートエンコーダのサンプルプログラムで遊んでみます。

早速プログラムを動かしてみます

keras / examples / variational_autoencoder.py を適当なフォルダーに格納します。


python variational_autoencoder.py

python variational_autoencoder.py

フォルダーに移動し、上記コマンドを入力すれば、プログラムが動きます。潜在変数Zは２次元です。

学習が完了すると、MNISTの０〜９の数字が潜在変数Zの２次元マップの何処にマッピングされたかの結果が表示されます（図の中の赤色の数字は、分かりやすいように後で追記しています）。

これの何が凄いかというと、教師なし学習なのに、同じ数字はマップの大体同じエリアに集まり、綺麗に分類されているということです。

もう１つ出力されるのが、これ。これは、潜在変数Zのデータから、どのような出力X’が生成されるかをマッピングしたものです。

これの何が凄いのかと言うと、画像を入力をしなくても、潜在変数Zのデータを操作するだけで、出力X’を生成しているんです。

しかも、正規分布に従うように学習しているので、隣り合った画像は連続的に変化するような分布になっています。

なので、潜在変数Zのデータを赤矢印のように操作して画像を生成させると、MNISTの数字のモーフィングができるはずです。やってみましょう。


    for i, yi in enumerate(grid_y):
        for j, xi in enumerate(grid_x):
            z_sample = np.array([[xi, yi]])
            x_decoded = decoder.predict(z_sample)
            digit = x_decoded[0].reshape(digit_size, digit_size)
            plt.imshow(digit,cmap='Greys_r')  ### 追加
            plt.savefig(str(i)+'@'+str(j)+'fig.png')  ### 追加    
            figure[i * digit_size: (i + 1) * digit_size,
                   j * digit_size: (j + 1) * digit_size] = digit

for i, yi in enumerate(grid_y):

for j, xi in enumerate(grid_x):

z_sample = np.array([[xi, yi]])

x_decoded = decoder.predict(z_sample)

digit = x_decoded[0].reshape(digit_size, digit_size)

plt.imshow(digit,cmap='Greys_r') ### 追加

plt.savefig(str(i)+'@'+str(j)+'fig.png') ### 追加

figure[i * digit_size: (i + 1) * digit_size,

j * digit_size: (j + 1) * digit_size] = digit

プログラムの93行目から99行目までのところに、上記の様に２行追加して、実行します。これで、出力画像を１枚づつ □□@△△fig.png （□□は行数、△△は列数）の形式で保存してくれます。

保存した出力画像から必要なものを拾って、GIF動画にすると、こんな感じになります。潜在変数Zの空間に連続的に数字が分布している感じが、この動画からも分かると思います。

VAE なかなか面白いですね。

次回は、オリジナルデータセットで再度VAEをやってみたいと思います。

では、また。

ABOUTこの記事をかいた人

ディープラーニング・エンジニアを趣味でやってます。E資格ホルダー。好きなものは、膨大な凡ショットから生まれる奇跡の１枚、右肩上がりのワクワク感、暑い国の新たな価値観、何もしない南の島、コード通りに動くチップ、完璧なハーモニー、仲間とのバンド演奏、数えきれない流れ星。

Keras で変分オートエンコーダ（VAE）をMNISTでやってみる

今回は、変分オートエンコーダ（VAE）のサンプルプログラムで遊んでみます。

早速プログラムを動かしてみます

コメントを残すコメントをキャンセル

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

Animate Anyoneで、１枚の画像から動画を生成する

SVDで静止画から動画を生成する

DiffMorpherを使って、拡散モデルでモーフィングを行う

Domo AIで、実写動画をアニメ化する

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

今回は、変分オートエンコーダ（VAE）のサンプルプログラムで遊んでみます。

早速プログラムを動かしてみます

コメントを残す コメントをキャンセル

RECOMMENDこちらの記事も人気です。

SONY Neural Network Console で転移学習をやっ…

StyleGAN-Humanで、全身画像を生成する

E2Poseで複数人の姿勢推定を高速に行う

MASK R-CNNで、画像から物体を検出し、形を推定する

AIで画像から鉛筆画を描く

Keras KMNISTでサクッと遊んでみる

Suno AIで、音楽を自動生成する。

CLIPDraw で、文から絵を描かせる

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

Animate Anyoneで、１枚の画像から動画を生成する

SVDで静止画から動画を生成する

DiffMorpherを使って、拡散モデルでモーフィングを行う

Domo AIで、実写動画をアニメ化する

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

コメントを残すコメントをキャンセル