PIFuで、1枚の人物画像から3Dモデルを作ってみる

cedro

5年前

1.はじめに

　従来、1枚の人物画像から3Dモデルを作るには3次元空間上の点をN×N×N(Nは解像度)の箱として全ての点で同時処理を行うために、解像度の3乗のメモリが必要なため解像度の高いモデリングは困難でした。

　今回ご紹介するのは、ディープラーニングを使って3次元空間上の点をサンプリングして一点一点別々に処理を行うPIFuというモデルで、メモリ容量に制限されず高解像度なモデルを復元を行うことを実現したものです。

2.PIFuとは？

　PIFu (Pixel-Aligned Implicit Function) は、1枚の画像から服を着た人の3Dモデルを高精度で再現できるディープラーニングのモデルです。このモデルは、3次元形状を推定する部分(Surface Reconstruction)と表面テクスチャーを推定する部分(Texture Inference)の2つで構成されています。

　3次元形状を推定する部分では、入力画像からエンコーダを用いてSurfaceの特徴量(Fv)を抽出します。そして、3次元空間上の点と2次元画像の距離(Depth)から、その点が3次元の人物の内部なのか外部なのかを推定します。学習時の損失関数は以下で表されます。

　そして、3次元形状周辺の正規分布と空間上の一様分布を16:1の割合でサンプリングして処理を行います。

　表面テクスチャーを推定する部分では、入力画像とSurfaceの特徴量からエンコーダを用いてTextureの特徴量(Fc)を抽出します。そして、Surfaceから一定距離の範囲で表面テクスチャーを推定します。学習時の損失関数は以下の式で表されます。

　こちらも、先程同様にサンプリングして処理を行います。

3.コード

　コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。

　まず、3次元モデルを作成する画像データを準備します。

　removebgなどを利用して人物を切り抜き、背景を黒にした mana.png (512×512ピクセル) とマスク mana_mask.png (512×512ピクセル) を作成し、sample_images/manaフォルダーに保存します。この時マスクのファイル名は必ず、***_mask.png という形にしておきます。

　次に、セットアップを行います。

# ライブラリー取得
!pip install torch==1.6.0+cu101 torchvision==0.7.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html
!pip install pytorch3d

# githubからコードをコピー
!git clone https://github.com/cedro3/PIFu.git
%cd /content/PIFu

# 学習済みモデルのダウンロード
!sh ./scripts/download_trained_model.sh

# ライブラリー取得

!pip install torch==1.6.0+cu101 torchvision==0.7.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html

!pip install pytorch3d

# githubからコードをコピー

!git clone https://github.com/cedro3/PIFu.git

%cd /content/PIFu

# 学習済みモデルのダウンロード

!sh ./scripts/download_trained_model.sh

　PIFu デモを実行します。

# 使用するデータを選択します
!sh ./scripts/test.sh './sample_images/mana' 'mana'

1 2	# 使用するデータを選択します !sh ./scripts/test.sh './sample_images/mana' 'mana'

# mp4を作成します
from lib.colab_util import *
obj_path = '/content/PIFu/results/mana/result_mana.obj'
video_path = '/content/PIFu/results/mana/result_mana.mp4'
video_display_path = '/content/PIFu/results/mana/result_mana_display.mp4'

renderer = set_renderer()
generate_video_from_obj(obj_path, video_path, renderer)

# we cannot play a mp4 video generated by cv2
!ffmpeg -i $video_path -vcodec libx264 $video_display_path -y -loglevel quiet
video(video_display_path)