Re:ゼロから始めるML生活

機械学習ド素人が、流行に乗ってニューラルネットとかその他いろいろ勉強してみるブログ

CIFAR-10に関する覚書

ニューラルネットワーク(最近は主にGAN)について絶賛勉強中ではありますが、実際に書いてみるといろんなデータセットを使うことになります。 今回はその中でもCIFAR-10についての覚書です。

参考にしたのはこちら。

aidiary.hatenablog.com

CIFAR-10

内容

約6万枚のラベル付きデータとなっており、10種類の画像から構成される。

ダウンロードサイト

CIFAR-10 and CIFAR-100 datasets

構成

python versionを解答すると、下記のような構成になっている

  • readme.html
  • batches.meta ラベル名のリスト
  • data_batch_1 教師データ1
  • data_batch_2 教師データ2
  • data_batch_3 教師データ3
  • data_batch_4 教師データ4
  • data_batch_5 教師データ5
  • test_batch テストデータ

画像

データセット
  • airplane
  • automobile
  • bird
  • cat
  • deer
  • dog
  • frog
  • horse
  • ship
  • truck

 サイズ

32 × 32

使い方

読み込み

dict形式で読み込まれる。