cedro-blog

E2Poseで複数人の姿勢推定を高速に行う

1.はじめに

 今回ご紹介するのは、複数人の姿勢推定を高速に行うE2Poseという技術です。

2.E2Poseとは?

 E 2Poseの情報については、Githubに Fully Convolutional Networks for End-to-End Multi-Person Pose Estimation(エンドツーエンドの複数人の姿勢推定のための完全な畳み込みネットワーク)というタイトルでコードが公開されています。

 しかしながら、論文は現在非公開になっています。論文が公開になり次第、内容を更新したいと思います。

3.コード

 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Open in Colab」ボタンをクリックすると動かせます。

 まず、セットアップを行います。

 

  videoで指定した動画の姿勢推定を行います。推定結果そのものは容量が大きいので、再エンコードして容量を小さくすると共に、videoの音声を付加しています。なお、videoに音声がない場合は、soundチェックボックスのチェックを外して下さい(そうしないとエラーになります)。

 自分のビデオを使用したい場合は、videoフォルダにmp4ファイルをアップロードして下さい。

 作成したビデオの再生は下記を実行して下さい。

https://cedro3.com/wp-content/uploads/2022/12/magic_pose.mp4

 左上にFPS(1秒当たりの処理フレーム数)が表示されていてますが、何と約30FPSと今までの倍くらいのスピードです。凄い!

 作成したビデオのダウンロードは下記を実行して下さい。

 では、また。

(オリジナルgithub)https://github.com/AISIN-TRC/E2Pose