トップページ -> 最新情報技術の実習と研究ツール -> Keras 2 の利用 -> Keras に付属のデータセットのうち画像以外のデータ
[サイトマップへ]  

Keras に付属のデータセットのうち画像以外のデータ

Python の kerasパッケージには,次のデータセットを簡単にダウンロードできる機能があります.

この Web ページでは、IMDB, Reuters newswire topics, Boston Housing Price を説明します. 残りの CIFAR10, CIFAR100, MNIST, Fashion MNIST は、別の Web ページで説明します

先人に感謝.


前準備

Anaconda のインストール

前準備として,Python 開発環境のAnaconda のインストールが終わっていること. Windows では Chocholatey のインストールが終わっていること

隔離された Python 環境の作成.Tensorflow, Keras, OpenCV, spyer のインストール

Windows での 手順は、 「Windows で,隔離された Python 環境 + Keras + TensorFlow + OpenCV + spyder + Dlib 環境を作る(Anaconda を利用)」のページで説明しています.

以下,Windows での Anaconda をインストール済み, 隔離された Python 環境(名前は ai)に、Tensorflow, Keras, OpenCV, spyder をインストール済みであるものとして説明を続けます.


Keras に付属のデータセットのうち画像以外のデータ

データセットとは、「データの集まり」のこと.

keras に付属のデータセットを取得するときのオプションについては, https://keras.io/ja/datasets/(日本語版), https://keras.io/datasets/(英語版) に説明されている.

ここでの、オブジェクトの名前付けのルール

IMDB Movie reviews sentiment classification

Python 処理系」で次を実行.(Anacondaに入っている開発環境 spyder を実行し,右下の ipython コンソールを使うのが簡単.)

from keras.datasets import imdb
(X_train, y_train), (X_test, y_test) = imdb.load_data()

配列のサイズ確認

print( X_train.shape )
print( y_train.shape )
print( X_test.shape )
print( y_test.shape )

X_train の先頭要素の表示(確認のため)

print( X_train[0] )

実習課題

IMDB Movie reviews sentiment classification データセットのうち学習用の配列データについて,配列の形,次元数,先頭要素の中身を,次のプログラムで確認しなさい

from keras.datasets import imdb
(X_train, y_train), (X_test, y_test) = imdb.load_data()
print( X_train.shape )
print( X_train.ndim )
print( X_train[0] )

Reuters newswire topics classification

Python 処理系」で次を実行.(Anacondaに入っている開発環境 spyder を実行し,右下の ipython コンソールを使うのが簡単.)

from keras.datasets import reuters
(X_train, y_train), (X_test, y_test) = reuters.load_data()

配列のサイズ確認

print( X_train.shape )
print( y_train.shape )
print( X_test.shape )
print( y_test.shape )

X_train の先頭要素の表示(確認のため)

print( X_train[0] )

実習課題

Reuters newswire topics classification データセットのうち学習用の配列データについて,配列の形,次元数,先頭要素の中身を,次のプログラムで確認しなさい

from keras.datasets import reuters
(X_train, y_train), (X_test, y_test) = reuters.load_data()
print( X_train.shape )
print( X_train.ndim )
print( X_train[0] )

Boston housing price regression dataset

Python 処理系」で次を実行.(Anacondaに入っている開発環境 spyder を実行し,右下の ipython コンソールを使うのが簡単.)

from keras.datasets import boston_housing
(X_train, y_train), (X_test, y_test) = boston_housing.load_data()

配列のサイズ確認

print( X_train.shape )
print( y_train.shape )
print( X_test.shape )
print( y_test.shape )

X_train の先頭要素の表示(確認のため)

print( X_train[0] )

実習課題

Boston housing price regression dataset データセットのうち学習用の配列データについて,配列の形,次元数,先頭要素の中身を,次のプログラムで確認しなさい

from keras.datasets import boston_housing
(X_train, y_train), (X_test, y_test) = boston_housing.load_data()
print( X_train.shape )
print( X_train.ndim )
print( X_train[0] )

以下、書きかけ

参考Webページ http://www.procrasist.com/entry/2017/01/07/154441

https://keras.io/getting-started/sequential-model-guide/ で言及されている次の事項について.

https://github.com/fchollet/keras/tree/master/examples に記載のプログラムを動かしてみる.

  • CIFAR 10

    https://github.com/fchollet/keras/blob/master/examples/cifar10_cnn.py を実行してみる.