トップページ -> データベース関連技術 -> 音声認識,音声合成 -> Python の SpeechRecognizer を用いて音声認識
[サイトマップへ], [サイト内検索へ]

Python の SpeechRecognizer を用いて音声認識

Python の SpeechRecognizer (https://github.com/Uberi/speech_recognition) を用いて音声認識

先人に感謝

キーワード: 音声認識, Google API, Python, SpeechRecognition


前準備

Python のインストール,pip と setuptools の更新,Python 開発環境のインストール

Windows の場合

  1. Python のインストール

    Python の URL: http://www.python.org/

    インストール手順の詳細は: 別ページで説明している.

  2. pip と setuptools の更新Python 開発環境(JupyterLab, spyder)のインストール

    コマンドプロンプトを管理者として実行し,次のコマンドを実行.

    python -m pip install -U pip setuptools
    python -m pip install -U jupyterlab jupyter jupyter-console jupytext spyder
    

Ubuntu の場合

システム Python を使用(インストール操作は不要)

  1. pip と setuptools の更新Python 開発環境(JupyterLab, spyder)のインストール

    次のコマンドを実行.

    sudo apt -yV install python3-dev python3-pip python3-setuptools
    sudo apt -yV install jupyter-qtconsole jupyter-notebook python3-jupyter-client python3-jupyter-console python3-spyder spyder3
    

Python のパッケージ SpeechRecognition, pyaudio のインストール

  1. Windows では,コマンドプロン プトを管理者として実行
  2. 次のコマンドを実行.

    ※ Windows では「python」,Ubuntu では「sudo python3 -m pip」

    python -m pip install -U SpeechRecognition
    

    [image]

    引き続き,次のコマンドを実行

    pip install -U pyaudio
    

    [image]

Python の SpeechRecognizer を用いて音声認識してみる

  1. まずは,入った .wav ファイルを準備する

    [image]

    ※ 手元に .wav ファイルがないよ,というときは http://www.wavsource.com(インターネットでは,下品な広告が付いている可能性があるので,必要もないのにクリックしないこと) などから入手できる(.wav ファイルをダウンロードするときは、利用条件などを確認すること)

  2. IPython シェル」を使う.
  3. Jupyter Qt Console を起動

    jupyter qtconsole
    

    [image]

    Python プログラムを動かして,結果を見たい.

    Jupyter Qt ConsolespyderPyCharmPyScripter が便利である. Windows では,スタートメニューの「IDLE (Python ...)」も便利である.

    ※ 「jupyter qtconsole」を入れたのに,jupyter qtconsole起動しない という場合には,次の操作で,インストールを行ってから,もう一度試してみる.

    ※ Windows では「python」,Ubuntu では「sudo python3 -m pip」

    python -m pip install -U jupyterlab jupyter jupyter-console jupytext spyder
    
  4. 次を実行
    import os
    print(os.getcwd())
    

    実行結果例

    [image]
  5. 先ほどの .wav ファイルはカレントディレクトリに移しておく(あとの作業を楽にするため)
  6. 英語の音声認識してみる

    Python コンソール」を使う.

    PyCharmか, Anacondaに入っているspyder を使うのが簡単

    次の Python プログラムを実行

    「"coincidence.wav" 」のところは,ファイル名を書き換えること.

    import speech_recognition
    r = speech_recognition.Recognizer()
    with speech_recognition.AudioFile("coincidence.wav") as source:
        audio = r.record(source)
    r.recognize_google(audio)
    

    実行結果の例

    [image]
  7. 日本語の音声認識をしたい場合には「language='ja-JP'」を指定する

    次の Python プログラムを実行

    「"1.wav" 」のところは,ファイル名を書き換えること.

    import speech_recognition
    r = speech_recognition.Recognizer()
    with speech_recognition.AudioFile("1.wav") as source:
        audio = r.record(source)
    r.recognize_google(audio, language='ja-JP')
    

    実行結果の例

    [image]

本サイトは金子邦彦研究室のWebページです.サイトマップは,サイトマップのページをご覧下さい. 本サイト内の検索は,サイト内検索のページをご利用下さい.

問い合わせ先: 金子邦彦(かねこ くにひこ) [image]