cedro-blog

CoNRで、いくつかのアニメからダンスビデオを作成する

1.はじめに

 今回ご紹介するのは、いくつかのアニメを元にポーズを指定することによってダンスビデオを作成する CoNR(Collaborative Neural Rendering)という技術です。

*この論文は、2022.6に提出されました。

2.CoNRとは?

 下記がCoNRの概要図です。狙いとするポーズ(Itar)をコンパクトなランドマーク数値で表されるUDP表現(Ptar)に変換します。

 一方、 いくつかのアニメ(Sref)をそれぞれU-Net形式のネットワークに入力してEncoderでエンコードし、UPD表現(Ptar)と共にDecoderでデコードします。このとき、複数のDecoderのD1〜D3の重みを共有することによって、狙いとするポーズのアニメを作成します。

3.コード

 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。

 まず、セットアップを行います。

 

 いくつかのアニメをまとめたキャラクターシートと狙いのポーズをまとめたUDPデータをセットします。style ‘double_ponytail’ あるいは ‘short_hair’ を選択するとサンプルデータを使用し、‘self_defined’ を選択すると自分のデータを使用できます。

  ’self_defined’ を選択して実行した場合は、その後にcharacter_sheetフォルダposesフォルダに必要なデータをアップロードして下さい。

 

 キャラクターシートの内容を表示させます。

 

 それでは、アニメーションを作成してみましょう。作成したアニメーションデータは順次 resultsフォルダ に保存されます。

 なお、サンプルデータ全体のアニメーション化(49秒)には1時間弱かかります。途中で再度実行ボタンを押して、ストップさせることも出来ます。

 

  resultsフォルダに出力されたアニメーションデータ(*.png)を元に動画の作成と再生を行います。これは、冒頭の13秒です。

 たった4枚のアニメからダンスビデオが作成できるのは面白いですね!

 では、また。

(オリジナルgithub)https://github.com/megvii-research/CoNR