Pythonは音声処理に優れたツールを提供しています。この記事では、Pythonを使って音声ファイルのスペクトログラムを作成する方法を説明します。
必要なライブラリのインストール
まずは、音声ファイルを読み込むために必要なライブラリをインストールします。以下のコマンドを実行してください。
pip install pydub
pip install numpy
pip install matplotlib
音声ファイルの読み込み
次に、音声ファイルを読み込みます。以下のコードを使用して、音声ファイルを読み込みます。
from pydub import AudioSegment
audio = AudioSegment.from_file("audio.wav")
スペクトログラムの作成
スペクトログラムを作成するためには、numpyとmatplotlibライブラリを使用します。以下のコードを使用して、スペクトログラムを作成します。
import numpy as np
import matplotlib.pyplot as plt
samples = np.array(audio.get_array_of_samples())
frequencies, times, spectrogram = signal.spectrogram(samples, audio.frame_rate)
plt.pcolormesh(times, frequencies, spectrogram, cmap='inferno')
plt.ylabel('Frequency [Hz]')
plt.xlabel('Time [sec]')
plt.show()
これで、音声ファイルのスペクトログラムを作成することができます。