Pythonで音声ファイルのスペクトログラムを可視化する方法

Pythonを使うと、音声ファイルのスペクトログラムを簡単に可視化できます。スペクトログラムは、時間と周波数の両方にわたる信号のスペクトルを表す3Dプロットであり、音声処理や音響分析において広く使用されています。

Pythonには、標準ライブラリとしてサウンド処理のためのモジュールが用意されています。scipyやnumpyなどの外部ライブラリも使用することができます。

以下は、Pythonを使用して音声ファイルのスペクトログラムを可視化するための簡単なコード例です。

import scipy.io.wavfile as wav
import matplotlib.pyplot as plt

sample_rate, data = wav.read("audio_file.wav")
plt.specgram(data, Fs=sample_rate)
plt.show()

このコードは、“audio_file.wav"というファイル名の音声ファイルを読み取り、そのスペクトログラムをMatplotlibを使用して表示します。

スペクトログラムをより正確に可視化するために、多くのパラメータがあります。たとえば、窓関数やFFTサイズ、周波数範囲などがあります。これらのパラメータを調整することにより、より高品質なスペクトログラムを生成することができます。