PAMAで、スタイル転送をやってみる

1.はじめに

 今回ご紹介するのは、以前よりも視覚的な不具合を防ぎ一貫性のあるスタイル転送を実現するPAMA(progressive attentional manifold alignment)という技術です。

*この論文は、2022.1に提出されました。

2.PAMAとは?

 下記がネットワークの概略図です。3つの独立したアテンション・マニホールド・アラインメント(AMA)を使用して、3段階でコンテンツとスタイルを徐々に融合します。点線は、トレーニング時にのみ使用される損失計算の途中結果です。

 下記がAMAで、左側のアテンション・モジュールでコンテンツFcとスタイルFsからアテンションマップAcsを作成し、右側の空間認識補間で重みWを取得しコンテンツとスタイルの補間に適用します。

 さて、このスタイル転送でどんな変換ができるの例を見てみましょう。左からコンテンツ画像、スタイル画像、アウトプットです。

 それでは、早速コードを動かしてみましょう。

3.コード

 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。

 まず、セットアップを行います。

 まず、画像のスタイル転送をやってみましょう。checkpoint(学習済みパラメータ)を4種類の中から選択し、contentには元画像、styleにはスタイル画像を設定して下さい。ここでは、checkpoint = ‘consistency’, content = ’08.jpg’, style = ’16.jpg’ を設定しています。

 自分で用意した画像を使用する場合は、元画像はcontentフォルダへ、スタイル画像はstyleフォルダへアップロードして下さい。

 出来た画像をダウンロードします。

 もう1つ設定を変えてやってみましょう。今度は、checkpoint = ‘consistency’, content = ’14.jpg’, style = ’16.jpg’ の設定です。

 

 次に、動画のスタイル変換をやってみましょう。checkpoint(学習済みパラメータ)を4種類の中から選択し、videoには元動画、styleにはスタイル画像を設定して下さい。ここでは、checkpoint = ‘consistency’, video = ’01.mpg’, style = ’16.jpg’ を設定しています。

 自分で用意した動画や画像を使用する場合は、元動画はvideoフォルダへ、スタイル画像はstyleフォルダへアップロードして下さい。なお、動画は音声付きにして下さい。

 意外なスタイル画像が面白い転送結果を出すことがお分かり頂けたかと思います。ぜひ、色々試してみて下さい。

 では、また。

(オリジナルgithub)https://github.com/computer-vision2022/PAMA

(twitter投稿)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

ABOUTこの記事をかいた人

アバター

ディープラーニング・エンジニアを趣味でやってます。E資格ホルダー。 好きなものは、膨大な凡ショットから生まれる奇跡の1枚、右肩上がりのワクワク感、暑い国の新たな価値観、何もしない南の島、コード通りに動くチップ、完璧なハーモニー、仲間とのバンド演奏、数えきれない流れ星。