金子邦彦研究室人工知能Ubuntu で動く人工知能関係 Pythonアプリケーション,オープンソースソフトウエアTesseract OCR のインストール(Ubuntu 上)

Tesseract OCR のインストール(Ubuntu 上)

Tesseract OCRは文字認識のソフトウェア

サイト内の関連ページ

● 実演ビデオ(YouTube)「Tesseract OCR 5 のインストール(Ubuntu 上)」

動画リンク: https://www.youtube.com/watch?v=dQu4GHy754o

前準備

Ubuntu のシステム更新

UbuntuUbuntu で OS のシステム更新を行うときは, 端末で,次のコマンドを実行する.

UbuntuUbuntu のインストールは別ページ »で説明

sudo apt -y update
sudo apt -yV upgrade
sudo /sbin/shutdown -r now

Tesseract OCR のインストール(Ubuntu 上)

  1. インストール操作
    sudo apt -y update
    sudo apt -y install tesseract-ocr tesseract-ocr-jpn libtesseract-dev libleptonica-dev tesseract-ocr-script-jpan tesseract-ocr-script-jpan-vert 
    
  2. 使用できる言語の確認
    tesseract --list-langs
    

    [image]
  3. テスト実行

    画像ファイルを用意し、テスト実行してみる

    tesseract 48.png outbase -l jpn
    cat outbase.txt 
    

    [image]

関連ソフトウェアのインストール

gImageReader は Tesseract OCR の GUI フロントエンド

sudo apt -y update
sudo apt -y install gimagereader