CIFAR-10とCIFAR-100が追加
こんにちは cedro です。
11/15にSONY Neural Network Console が1.00 から1.10にバージョンアップされたのはご存知ですか。
バージョンアップの中には、皆さんお待ちかねのサンプル画像の追加が含まれています。やっぱり、MNISTだけじゃ地味過ぎますからねー。
追加されたのは、超有名なCIFAR-10 と CIFAR-100です。
CIFAR-10がこれです。飛行機~トラックまで10クラスに分けた画像データで、カラー32×32ピクセル、学習データが50,000枚、評価データが10,000枚というものです。
CIFAR-100は紹介する画像はありませんが、海洋哺乳類~乗り物まで100クラスに分けた画像データで、カラー32×32ピクセル、学習データが50,000枚、評価データが10,000枚というものです。CIFAR-10と比べると1クラス当たりの枚数は1/10になります。
データセットを作ったのは、AlexNet を使ってILSVRC2012で優勝したAlex 氏のグループで、これらは一般物体認識のベンチマークとして良く使われいるらしいです。
何かワクワクして来ました。
Neural Network Libraries をインストールします
但し、正確に言うと、今回追加されたのは、画像データそのものではなく、画像データをダウンロードして学習ファイルと評価ファイルを作成する、プログラムです。
せっかくなら、画像データの形で提供してくれると、もっと嬉しいのですが、何か著作権みたいなものが関係しているのでしょうか。
いずれにしても、Neural Network Libraries をインストールして、プログラムを実行する必要があります。
その手順を備忘録で書いておきます。詳細は、Webで調べると山ほど出てきますので、簡単なメモ程度にします。
1)Microsoft Visual C++ 2015 Redistributable のインストール
https://www.microsoft.com/en-us/download/details.aspx?id=52685
2)Anaconda ( pyhton3.6 version ) のインストール
https://www.anaconda.com/download/
3)NNabla の仮想環境の作成
Anaconda Navigator を起動し、中央下にある +create ボタンで、 nnabla の仮想環境(python 3.6)を作成する。
4)scipy scikit-image ipythonのインストール
作成した nnabla の仮想環境の矢印を押して、Open Terminal を開き
> conda install scipy scikit-image ipython
5)pyWin32のインストール
> conda install -c anaconda pywin32
6)NNabla のインストール
> pip install nnabla
7)インストール出来たかの確認
> pythonと入力し、対話モードにします
>>> import nnabla と入力し
Initializing CPU extension … と表示されればOKです。
>>> exit() 対話モードを終了します。
プログラムを実行します
Anaconda Navigator を起動し、NNabla 環境でOpen Terminal をクリックします。
1 2 3 4 |
(C:\Users\cedro\Anaconda\envs\nnabla) C:\neural_network_console_110\samples\sanmple_dataset\CIFAR-10 > python create_cifar10_csv.py |
プログラムの入っているディレクトりに移り、pythonコマンドで、プログラムcreate_cifar10_csv.py を実行します。
1回目は、モジュール tqdm がないというエラーが出たので、> conda install tqdm とやって、モジュールを入れました。
再度プログラムを実行すると、今度は上手く行きました。
最後に、Dataset Creation Completed と表示されればOKです。
そうすると、フォルダーCIFAR-10の中に、学習画像フォルダ、評価画像フォルダ、学習ファイル、評価ファイルが作成されます。
CIFAR-100の方も同様に、プログラムを実行します。
MNISTだと、もう認識率は99%以上いっちゃったし、もうやることないよねとお嘆きの貴兄には、待望のプレゼントではないでしょうか。
では、また。
参考にさせて頂いています。
深層学習に興味があるものの、pythonを触ったこともないままneural network consoleを入れてしまい四苦八苦している学生です。
このページの手順に沿ってcreate_cifar10_csv.pyファイルを実行したのですがCIFAR10フォルダ内に作成されたのはcifar10_test.csvとcifar10_training.csvファイルのみで、ともに中身はx:image,y:labelのセル2つのみでした。
仮想環境下で実行したときは確かに何かを実行していた(ある程度時間が掛かっていたし、Dataset Creation Completedのメッセージも出た)のですがその実行結果がどこにいってしまったのかわかりません汗
何か原因となっていそうなものを教えて頂けると大変助かります。
TKYさんへ
コメントありがとうございます。
私も、まだPython初心者なので、的確なアドバイスは難しいです(笑)。
もっと簡単なCIFAR10のインストール方法が見つかりましたので、それを一度お試し下さい。
2018.02.20のブログ「SONY Neural Network Console で転移学習をやってみる」の一番最後にある「PS、CIFAR10のデータセットを読み込む方法」というところに記載しましたので、試してみて下さい。