cedro-blog

MMDetectionで、インスタンスセグメンテーションをやってみる

1.はじめに

 今回ご紹介するのは、物体検出フレームワーク MMDetectionを使った、インスタンスセグメンテーション(画像から物体を検出し、形を推定するタスク)です。

2.MMDetectionとは?

  MMDetectionは、あらかじめ用意されたモジュールを組み合わせることで様々な物体検出のモデルを設計できるフレームワークです。設計内容はconfigファイルに記述し、今回の設計内容は以下の様です。

 config = ‘configs/mask_rcnn/mask_rcnn_r50_caffe_fpn_mstrain-poly_3x_coco.py'

 早速、コードを動かしてみましょう。

3.コード

 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。

 まず、セットアップを行います。mmcv-fullのインストールに時間が掛かるため、セットアップ全体では20〜30分位です。

 

 サンプル画像のインスタンスセグメンテーションをやってみましょう。自分の画像でやってみたい場合は、demoフォルダーへその画像をアップロードし、img: でその画像を指定して下さい。

 下記で、検出した画像を表示します。

 

 それでは、サンプル動画でインスタンスセグメンテーションをやってみましょう。自分の動画でやってみたい場合は、demoフォルダーへその動画をアップロードし、! python demo/video_demo.py demo/demo2.mp4 demo2.mp4を自分の動画名に置き換えて下さい。

 動画は result.mp4 に保存されます。こんな感じ。

 ダンスする人々のインスタンスセグメンテーションが的確に行われていますね。

 では、また。

(オリジナルgithub)https://github.com/open-mmlab/mmdetection