Pythonで音声ファイルのスペクトログラムを作成する方法

Pythonは音声処理に優れたツールを提供しています。この記事では、Pythonを使って音声ファイルのスペクトログラムを作成する方法を説明します。

必要なライブラリのインストール

まずは、音声ファイルを読み込むために必要なライブラリをインストールします。以下のコマンドを実行してください。

pip install pydub
pip install numpy
pip install matplotlib

音声ファイルの読み込み

次に、音声ファイルを読み込みます。以下のコードを使用して、音声ファイルを読み込みます。

from pydub import AudioSegment
audio = AudioSegment.from_file("audio.wav")

スペクトログラムの作成

スペクトログラムを作成するためには、numpyとmatplotlibライブラリを使用します。以下のコードを使用して、スペクトログラムを作成します。

import numpy as np
import matplotlib.pyplot as plt

samples = np.array(audio.get_array_of_samples())
frequencies, times, spectrogram = signal.spectrogram(samples, audio.frame_rate)

plt.pcolormesh(times, frequencies, spectrogram, cmap='inferno')
plt.ylabel('Frequency [Hz]')
plt.xlabel('Time [sec]')
plt.show()

これで、音声ファイルのスペクトログラムを作成することができます。

必要なライブラリのインストール#

音声ファイルの読み込み#

スペクトログラムの作成#

必要なライブラリのインストール

音声ファイルの読み込み

スペクトログラムの作成