ECONで、1枚の写真から3Dモデルを推定する

1.はじめに

 今回ご紹介するのは、1枚の写真から3Dモデルを推定するモデルの最新版である、ECONという技術です。

2.ECONとは?

 従来のモデル推定は、正面図と背面図を推定したものをそのまま使ってモデル推定していました。ECONでは、この2つを組み合わせて下記の3点を最適化することで完成度を上げています。

  • 高周波数のサーフェスの詳細が法線マップと一致する
  • 不連続性を含む低周波数のサーフェスのバリエーションが SMPL-X サーフェスと一致する
  • 前後の2.5D曲面のシルエットは互いに首尾一貫している。

3.コード

 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Open in Colab」ボタンをクリックすると動かせます。

 まず、下記のコードを順次実行し、セットアップを行います。最後のブロック(Downloading required models and extra data)でモデルをダウンロードする前に、colabに記載されているリンクにユーザー登録してユーザーネームとパスワードを取得して下さい。最後のブロックを実行すると、ユーザーネームとパスワードを入力する必要があります。

 

 それでは、写真から3Dモデルを推定してみましょう。まず、examplesに保存されている写真(001.jpg〜038.jpg)の中から、今回使用する写真を指定します。ここでは、file_name = 033.jpg と設定しています。

filename = 033

 写真の下に表示される filename は後で使うので覚えておいて下さい。

 次に、3Dモデル推定を行います。なお、For single -parsonの方をコメントアウトし、For multi-personの方のコメントアウトを外すと、複数人への対応も可能です。

 

 ビデオを作成します。このブロックでは、“python -m apps.multi_render -n”の後を、先程のfilenameで表示された名前に修正して下さい。ここでは、先程 表示された filename = 033 を記載しています。

 

 作成したビデオを再生します。

 

 作成したビデオをダウンロードします。

 以前の技術と比べると精度が着実に上がっていますね。では、また。

(オリジナルgithub)https://github.com/YuliangXiu/ECON

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

ABOUTこの記事をかいた人

アバター

ディープラーニング・エンジニアを趣味でやってます。E資格ホルダー。 好きなものは、膨大な凡ショットから生まれる奇跡の1枚、右肩上がりのワクワク感、暑い国の新たな価値観、何もしない南の島、コード通りに動くチップ、完璧なハーモニー、仲間とのバンド演奏、数えきれない流れ星。