E2Poseで複数人の姿勢推定を高速に行う

1.はじめに

 今回ご紹介するのは、複数人の姿勢推定を高速に行うE2Poseという技術です。

2.E2Poseとは?

 E 2Poseの情報については、Githubに Fully Convolutional Networks for End-to-End Multi-Person Pose Estimation(エンドツーエンドの複数人の姿勢推定のための完全な畳み込みネットワーク)というタイトルでコードが公開されています。

 しかしながら、論文は現在非公開になっています。論文が公開になり次第、内容を更新したいと思います。

3.コード

 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Open in Colab」ボタンをクリックすると動かせます。

 まず、セットアップを行います。

 

  videoで指定した動画の姿勢推定を行います。推定結果そのものは容量が大きいので、再エンコードして容量を小さくすると共に、videoの音声を付加しています。なお、videoに音声がない場合は、soundチェックボックスのチェックを外して下さい(そうしないとエラーになります)。

 自分のビデオを使用したい場合は、videoフォルダにmp4ファイルをアップロードして下さい。

 作成したビデオの再生は下記を実行して下さい。

 左上にFPS(1秒当たりの処理フレーム数)が表示されていてますが、何と約30FPSと今までの倍くらいのスピードです。凄い!

 作成したビデオのダウンロードは下記を実行して下さい。

 では、また。

(オリジナルgithub)https://github.com/AISIN-TRC/E2Pose

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

ABOUTこの記事をかいた人

アバター

ディープラーニング・エンジニアを趣味でやってます。E資格ホルダー。 好きなものは、膨大な凡ショットから生まれる奇跡の1枚、右肩上がりのワクワク感、暑い国の新たな価値観、何もしない南の島、コード通りに動くチップ、完璧なハーモニー、仲間とのバンド演奏、数えきれない流れ星。