音声認識は、近年急速に発展しており、音声認識機能を備えたアプリケーションはますます増えています。Pythonを使用すると、リアルタイム音声認識を簡単に実現できます。
必要なライブラリのインストール
リアルタイム音声認識を実現するために、以下のPythonライブラリが必要です。
- PyAudio
- SpeechRecognition
これらのライブラリをインストールするには、pipを使用します。
pip install pyaudio SpeechRecognition
コードの記述
以下のコードを使用して、リアルタイム音声認識を実現できます。
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
r.adjust_for_ambient_noise(source)
print("話しかけてください...")
while True:
audio = r.listen(source)
try:
text = r.recognize_google(audio, language='ja-JP')
print("あなたが言ったこと: {}".format(text))
except:
print("もう一度お願いします")
コードの説明
speech_recognitionライブラリをインポートし、Recognizerオブジェクトを作成します。Microphoneオブジェクトを作成し、ノイズを除去します。- マイクに向かって話しかけるように指示し、音声を録音します。
- Googleの音声認識APIを使用して、音声をテキストに変換します。
- 変換されたテキストを出力します。
結論
Pythonを使用すると、簡単にリアルタイム音声認識を実現できます。PyAudioとSpeechRecognitionのインストールと上記のコードを使用することで、音声をテキストに変換するアプリケーションを開発することができます。