サイトの全体構成

imglab を用いた画像のアノテーション（Dlib, Dlib の imglab, Python を使用）（Windows 上）

Dlibは，機械学習のアルゴリズムの機能を持つソフトウェア．

利用条件などは利用者において確認してください

【サイト内の関連ページ】

説明資料: Dlib の機能概要 [PDF], [パワーポイント]

謝辞

Dlib の作者に感謝します

前準備

Build Tools for Visual Studio 2022 （ビルドツール for Visual Studio 2022），Visual Studio 2022 のインストール（Windows 上）

【サイト内の関連ページ】

Visual Studio の機能のうちビルドツール（Build Tools）以外の機能も使う予定がある場合，あるいは，よく分からない場合
Windows での Visual Studio Community 2022 のインストール: 別ページ »で説明している．なお，Visual Studio には，ビルドツール（Build Tools）が含まれている．
Visual Studio の機能のうちビルドツール（Build Tools）の機能しか使わない場合
Windows でのビルドツール for Visual Studio 2022 （Build Tools for Visual Studio 2022）のインストール: 別ページ »で説明している．

【関連する外部ページ】

Build Tools for Visual Studio 2022 の公式ページ: https://visualstudio.microsoft.com/ja/downloads/

Git のインストール（Windows 上）

Gitは，バージョン管理システム．ソースコードの管理や複数人での共同に役立つ．

【サイト内の関連ページ】

Windows での Git のインストール: 別ページ »で説明している．

【関連する外部ページ】

Git の公式ページ: https://git-scm.com/

CMake のインストール

CMake の公式ダウンロードページ: https://cmake.org/download/

Windows での cmake のインストール: 別ページ »で説明
CMake のインストールでは，システム環境変数 Path への追加を忘れないこと: C:\Program Files (x86)\GnuWin32\bin

7-Zip のインストール（Windows 上）

7-Zip 23.01 のインストール

7-Zipは，ファイルの圧縮や展開のツール．さまざまなフォーマットに対応している．

Windows では，コマンドプロンプトを 管理者として開き，次のコマンドを実行することにより， 7-Zip 23.01 のインストールを行うことができる．

mkdir %HOMEPATH%\7zip
cd %HOMEPATH%\7zip
curl -O https://www.7-zip.org/a/7z2301-x64.exe
.\7z2301-x64.exe
powershell -command "$oldpath = [System.Environment]::GetEnvironmentVariable(\"Path\", \"Machine\"); $oldpath += \";c:\Program Files\7-Zip\"; [System.Environment]::SetEnvironmentVariable(\"Path\", $oldpath, \"Machine\")"

【サイト内の関連ページ】

Windows での 7-Zip のインストール: 別ページ »で説明している．

【関連する外部ページ】

7-Zip の公式ページ: https://sevenzip.osdn.jp/

Python のインストール（Windows 上）

【サイト内の関連ページ】

Windows での Python 3.10，関連パッケージ，Python 開発環境のインストール: 別ページ »で説明している．
Windows での Anaconda3 のインストール: 別ページ »で説明している．
Python のまとめ: 別ページ »にまとめている．

【関連する外部ページ】

Python の公式ページ: https://www.python.org/

Build Tools for Visual Studio 2022 （ビルドツール for Visual Studio 2022），Visual Studio 2022 のインストール（Windows 上）

【サイト内の関連ページ】

Visual Studio の機能のうちビルドツール（Build Tools）以外の機能も使う予定がある場合，あるいは，よく分からない場合
Windows での Visual Studio Community 2022 のインストール: 別ページ »で説明している．なお，Visual Studio には，ビルドツール（Build Tools）が含まれている．
Visual Studio の機能のうちビルドツール（Build Tools）の機能しか使わない場合
Windows でのビルドツール for Visual Studio 2022 （Build Tools for Visual Studio 2022）のインストール: 別ページ »で説明している．

【関連する外部ページ】

Build Tools for Visual Studio 2022 の公式ページ: https://visualstudio.microsoft.com/ja/downloads/

Dlib のインストール

Windows で，コマンドプロンプトを管理者として実行

Windows で pip を実行するときは，コマンドプロンプトを管理者として開き，それを使って pip を実行することにする．
コマンドプロンプトを管理者として実行: 別ページ »で説明
次のコマンドを実行する．
```
python -m pip install -U dlib
```

Dlib のソースコード等と，Dlib の学習済みモデルのダウンロード

Windows で，コマンドプロンプトを管理者として実行

コマンドプロンプトを管理者として実行: 別ページ »で説明
Dlib のソースコード等のダウンロード
次のコマンドを実行．
```
cd C:\
rmdir /s /q dlib
git clone https://github.com/davisking/dlib
```

Dlib の学習済みモデルのダウンロード

次のコマンドを実行．

cd C:\dlib
cd python_examples
curl -O http://dlib.net/files/mmod_human_face_detector.dat.bz2
curl -O http://dlib.net/files/dlib_face_recognition_resnet_model_v1.dat.bz2
curl -O http://dlib.net/files/shape_predictor_5_face_landmarks.dat.bz2
curl -O http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x mmod_human_face_detector.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x dlib_face_recognition_resnet_model_v1.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x shape_predictor_5_face_landmarks.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x shape_predictor_68_face_landmarks.dat.bz2
del mmod_human_face_detector.dat.bz2
del dlib_face_recognition_resnet_model_v1.dat.bz2
del shape_predictor_5_face_landmarks.dat.bz2
del shape_predictor_68_face_landmarks.dat.bz2

Python 用 numpy, scikit-image のインストール

Windows の場合

Windows で，コマンドプロンプトを管理者として実行

Windows で pip を実行するときは，コマンドプロンプトを管理者として開き，それを使って pip を実行することにする．
コマンドプロンプトを管理者として実行: 別ページ »で説明

次のコマンドを実行する．

python -m pip install -U numpy scikit-image

Ubuntu の場合

次のコマンドを実行．

sudo apt -y update
sudo apt -y install python3-numpy python3-skimage

Dlib の imglab のインストール

前準備として、Windows のときはマイクロソフト C++ ビルドツール (Build Tools) のインストールが終わっていること

Windows で，コマンドプロンプトを管理者として実行

コマンドプロンプトを管理者として実行: 別ページ »で説明

次のコマンドを実行

cd C:\dlib
cd tools\imglab
rmdir /s /q build
mkdir build
cd build
cmake -G "Visual Studio 17 2022" -A x64 -T host=x64 ^
    -DCMAKE_INSTALL_PREFIX="%HOMEPATH%\dlib" ..
cmake --build . --config RELEASE 
cmake --build . --config RELEASE --target INSTALL -- /m:4

結果を確認．エラーメッセージが出ていないこと

ここで，「%HOMEPATH%\dlib」は，Dlib のソースコードを展開したディレクトリに読み替えること。

imglab を使ってみる

画像を数枚準備する
準備した画像ファイルを，次のディレクトリに置く
```
%HOMEPATH%\dlib\bin
```
画像ファイルの準備が終わったら、 .xml 形式ファイルを作る．
Windows のコマンドプロンプトを開き、次のコマンドを実行する．エラーメッセージが出ないことを確認．
「.\imglab.exe -c mydata.xml .」は、.xml 形式ファイルを作るコマンド．ファイル名 mydata.xml は何でもよい
```
C:
cd C:\dlib\bin
.\imglab.exe -c mydata.xml .
```
生成された .xml 形式ファイルをエディタなどで開き確認してみる．
```
notepad mydata.xml
```
imglab を起動してみる
Windows のコマンドプロンプトで、次のコマンドを実行する．
```
.\imglab.exe mydata.xml 
```
imglab は，画像ビューワになっている
- 複数の画像を簡単に表示できる機能がある。
- ラベル（label）を編集する機能がある (Next Labelのところに書き込む)
- 領域を指定する機能がある（シフトキー（SHIFT キー）を押しながら、マウスをドラッグ）
imglab で、領域を指定してみる
シフトキー（SHIFT キー）を押しながら、マウスをドラッグ<
保存する
「File」→「Save」」と操作する
確かに .xml形式ファイルに，結果が保存される
指定した領域についての情報が保存される

Dlib を用いた学習

教材ファイル Release.zip をダウンロードし，%HOMEPATH%\dlib\bin に置く

C:
cd C:\dlib\bin
curl -O https://www.kkaneko.jp/sample/dog/Release.zip
"c:\Program Files\7-Zip\7z.exe" x Release.zip

Web ブラウザで training.xml を開いて、確認してみる
14枚の画像について、領域を指定済み
Google Chrome ではうまく表示できない．下の図では Firefox での表示結果を示している．
imglab を起動して確認してみる
Windows のコマンドプロンプトで、次のコマンドを実行する．
```
C:
cd C:\dlib\bin
.\imglab.exe training.xml
```
imglab を閉じる

学習を行う（教師データの生成）

最後の「.」を忘れないこと

copy %HOMEPATH%\dlib\examples\faces\*.jpg .
python C:\dlib\python_examples\train_object_detector.py .

途中で、Enterキーを押して続行

Python プログラムの実行

謝辞：http://tadaoyamaoka.hatenablog.com/entry/2016/09/21/184955　のものを参考に（少し変更して）使っています

Python プログラムの実行（Windows 上）

python: python
pip: python -m pip または pip
Jupyter Qt Console: jupyter qtconsole
Jupyter ノートブック (Jupyter Notebook): jupyter notebook
Jupyter Lab: jupyter lab あるいは python -m jupyter lab
Nteract: jupyter nteract あるいは python -m jupyter nteract
Spyder: spyder

コマンドプロンプトで次を実行

python

次の Python プログラムを実行

import os
import sys
import glob

import dlib
from skimage import io

f = '5920652345_5be61ae940.jpg'

detector = dlib.simple_object_detector("detector.svm")

win_det = dlib.image_window()
win_det.set_image(detector)

win = dlib.image_window()

print("Processing file: {}".format(f))
img = io.imread(f)
dets = detector(img)
print("Number of objects detected: {}".format(len(dets)))
for k, d in enumerate(dets):
    print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format(
        k, d.left(), d.top(), d.right(), d.bottom()))

win.clear_overlay()
win.set_image(img)
win.add_overlay(dets)
dlib.hit_enter_to_continue()

上の犬の写真では、画像分類がうまくいっていない

学習に使う画像を増やすには
```
.\imglab training.xml
```

本サイトは金子邦彦研究室のWebページである．

資料等の公開では，原則，「クリエイティブコモンズ BY NC SA」として公開するようにしている． PDFファイル，パワーポイントファイルなどには，「クリエイティブコモンズ BY NC SA」を明記するとともに，ロゴを記載するようにしている（作業が間に合っていない分もあるのでご容赦ください）．

公開している資料をご利用になる場合の，再配布の条件，剽窃の防止などについて，別ページ »で説明再配布や資料改変の際には，そのページをご確認ください．

サイトマップは，サイトマップのページをご覧下さい．本サイト内の検索は，サイト内検索のページをご利用下さい．

問い合わせ先：金子邦彦（かねこくにひこ） [image]