FaceTalkで、音声から顔の３Dアニメーションを作成する

1.はじめに

　以前からこのブログでは、音声から顔画像を動かす技術（Live Speech Portraits、MakeitTalk）をご紹介して来ましたが、それらはいずれも出力が２次元でした。今回ご紹介するのは、音声から顔の３Dアニメーションを作成するFaceTalkという技術です。

2.FaceTalkとは？

　下記がシステムの概要です。まず、顔の３Dメッシュ・テンプレート（template mesh）をエンコードして特徴量に変換し、それをデコードしてアニメーションした顔の３Dメッシュ（animated mesh）に復元するU -Netを用意します。

　そして、音声（Speech signal）と顔の３Dキャプチャ信号（expression signal）をそれぞれエンコードしたものを融合し、カテゴリの潜在的な表現空間（Categorical latent space）にマッピングして、U -Netの特徴量に作用させます。

　それでは、早速コードを動かしてみましょう。

3.コード

　コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。

　まず、セットアップを行います。pytorch3dのインストールはpipでは上手く行かず、Building wheelsで行う必要がありセットアップに20分位かかりますので、しばらくお待ちください。

#@title セットアップ（20分位かかります）
# githubからコードを取得
! git clone https://github.com/cedro3/meshtalk.git
%cd meshtalk

# pytorch3dインストール
!pip install 'git+https://github.com/facebookresearch/pytorch3d.git@stable'

# ffmpeg-pythonインストール
! pip install ffmpeg-python

# 学習済みパラメータのダウンロード
import urllib.request
! wget https://github.com/facebookresearch/meshtalk/releases/download/pretrained_models_v1.0/pretrained_models.zip
! unzip pretrained_models.zip

# movieフォルダ作成
import os
os.makedirs('movie', exist_ok=True)

#@title セットアップ（20分位かかります）

# githubからコードを取得

! git clone https://github.com/cedro3/meshtalk.git

%cd meshtalk

# pytorch3dインストール

!pip install 'git+https://github.com/facebookresearch/pytorch3d.git@stable'

# ffmpeg-pythonインストール

! pip install ffmpeg-python

# 学習済みパラメータのダウンロード

import urllib.request

! wget https://github.com/facebookresearch/meshtalk/releases/download/pretrained_models_v1.0/pretrained_models.zip

! unzip pretrained_models.zip

# movieフォルダ作成

import os

os.makedirs('movie', exist_ok=True)

　animete_face.py で音声からFaceMash動画を作成します。audioに、audioフォルダにある音声ファイル（wav）のどれを使用するか記入します。自分の用意した音声を使用する場合は事前にaudioフォルダにアップロードしておいて下さい。

#@title 音声から動画を作成
audio = 'mix.wav'#@param {type:"string"}
audio_path = 'audio/'+audio

! python animate_face.py --model_dir pretrained_models\
                          --audio_file $audio_path\
                          --output output.mp4

#@title 音声から動画を作成

audio = 'mix.wav'#@param {type:"string"}

audio_path = 'audio/'+audio

! python animate_face.py --model_dir pretrained_models\

--audio_file $audio_path\

--output output.mp4

　作成した動画を再生します。

#@title 動画の再生
from IPython.display import HTML
from base64 import b64encode

mp4 = open('output.mp4', 'rb').read()
data_url = 'data:video/mp4;base64,' + b64encode(mp4).decode()
HTML(f"""
<video width="50%" height="50%" controls>
      <source src="{data_url}" type="video/mp4">
</video>""")

#@title 動画の再生

from IPython.display import HTML

from base64 import b64encode

mp4 = open('output.mp4', 'rb').read()

data_url = 'data:video/mp4;base64,' + b64encode(mp4).decode()

HTML(f"""

</video>""")

　作成した動画をダウンロードする場合は、下記を実行します。

#@title 動画のダウンロード
import os
import shutil
from google.colab import files

name = os.path.splitext(audio)
file_name = 'movie/'+name[0]+'.mp4'
shutil.copy('output.mp4', file_name)
files.download(file_name)

#@title 動画のダウンロード

import os

import shutil

from google.colab import files

name = os.path.splitext(audio)

file_name = 'movie/'+name[0]+'.mp4'

shutil.copy('output.mp4', file_name)

files.download(file_name)

　では、また。

（オリジナルgithub）https://github.com/facebookresearch/meshtalk

FaceTalkで、音声から顔の３Dアニメーションを作成する

1.はじめに

2.FaceTalkとは？

3.コード

コメントを残すコメントをキャンセル

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

Animate Anyoneで、１枚の画像から動画を生成する

SVDで静止画から動画を生成する

DiffMorpherを使って、拡散モデルでモーフィングを行う

Domo AIで、実写動画をアニメ化する

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

1.はじめに

2.FaceTalkとは？

3.コード

コメントを残す コメントをキャンセル

RECOMMENDこちらの記事も人気です。

VIBEで、人の動画から3Dモデルを推定する

PyTorch で Conditional GAN をやってみる

One Shot Talking Face を使って音声で顔画像を動かす

SONY Neural Network Console 家賃を推定するニ…

StyleGANを使った画像編集をe4eで高速化する

SONY Neural Network Libraries でDCGAN…

Keras LSTMでトレンド予測をしてみる

Keras で変分オートエンコーダ（VAE）を漢字データセットでやってみる

ABOUTこの記事をかいた人

NEW POSTこのライターの最新記事

Animate Anyoneで、１枚の画像から動画を生成する

SVDで静止画から動画を生成する

DiffMorpherを使って、拡散モデルでモーフィングを行う

Domo AIで、実写動画をアニメ化する

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

コメントを残すコメントをキャンセル