トップページ人工知能,実世界DB音声認識,音声合成Python の SpeechRecognizer を用いて音声認識

Python の SpeechRecognizer を用いて音声認識

Python の SpeechRecognizer (https://github.com/Uberi/speech_recognition) を用いて音声認識

先人に感謝

キーワード: 音声認識, Google API, Python, SpeechRecognition

前準備

Python のインストール,pip と setuptools の更新,Python 開発環境

Python の URL: http://www.python.org/

【Python, pip の使い方】

Python, pip は,次のコマンドで起動できる.

Python 開発環境のインストール】

Python のパッケージ SpeechRecognition, pyaudio のインストール

  1. Windows では,コマンドプロン プトを管理者として実行する.
  2. 次のコマンドを実行.

    Windows では「python」,Ubuntu では「sudo python3 -m pip」

    python -m pip install -U SpeechRecognition
    

    [image]

    引き続き,次のコマンドを実行

    pip install -U pyaudio
    

    [image]

Python の SpeechRecognizer を用いて音声認識してみる

  1. まずは,入った .wav ファイルを準備する

    [image]

    ※ 手元に .wav ファイルがないよ,というときは http://www.wavsource.com(インターネットでは,下品な広告が付いている可能性があるので,必要もないのにクリックしないこと) などから入手できる(.wav ファイルをダウンロードするときは、利用条件などを確認すること)

  2. Python プログラムを動かす.

    Python プログラムを動かすために, Windows では「python」, Ubuntu では「python3」などのコマンドを使う.

    あるいは, 開発環境や Python コンソール(Jupyter Qt ConsoleSpyderPyCharmPyScripter など)の利用も便利である.

    あるいは,オンラインで動くGoogle Colaboratory のノートブックの利用も,場合によっては便利である.

  3. 次を実行
    import os
    print(os.getcwd())
    

    実行結果例

    [image]
  4. 先ほどの .wav ファイルはカレントディレクトリに移しておく(あとの作業を楽にするため)
  5. 英語の音声認識してみる

    次の Python プログラムを実行

    「"coincidence.wav" 」のところは,ファイル名を書き換えること.

    import speech_recognition
    r = speech_recognition.Recognizer()
    with speech_recognition.AudioFile("coincidence.wav") as source:
        audio = r.record(source)
    r.recognize_google(audio)
    

    実行結果の例

    [image]
  6. 日本語の音声認識をしたい場合には「language='ja-JP'」を指定する

    次の Python プログラムを実行

    「"1.wav" 」のところは,ファイル名を書き換えること.

    import speech_recognition
    r = speech_recognition.Recognizer()
    with speech_recognition.AudioFile("1.wav") as source:
        audio = r.record(source)
    r.recognize_google(audio, language='ja-JP')
    

    実行結果の例

    [image]