matinal：python 读取音频文件的几种方式

由于本人研究的音频方面，一开始读取音频文件的时候就遇到了一些问题

SAPmatinal

987人浏览 · 2023-09-29 11:06:32

SAPmatinal · 2023-09-29 11:06:32 发布

前言

由于本人研究的音频方面，一开始读取音频文件的时候就遇到了一些问题，比如，这个函数返回的是numpy,另外一个函数返回tensor，巴拉巴拉等等问题，所以在这里做一个简单的整理。

1、wavefile.read
代码示例如下：

from scipy.io import wavfile
fs, audio = wavfile.read("0.wav")
print(type(audio))
得到的结果为：

<class 'numpy.ndarray'>
2、soundfile.read
代码示例如下：

import soundfile as sf
audio, fs = sf.read("0.wav")
print(type(audio))
得到的结果为：

<class 'numpy.ndarray'>
3、librosa.load
代码示例如下：

import librosa
audio, fs = librosa.load("0.wav")
print(type(audio))
得到的结果为：

<class 'numpy.ndarray'>
4、torchaudio.load
代码示例如下：

import torchaudio
audio, fs = torchaudio.load("0.wav")
print(type(audio))
返回的结果为：

<class 'torch.Tensor'>
需要注意的两点：

(1)wavefile、soundfile、torchaudio返回的fs是文件本身的采样率；librosa返回的fs默认22050Hz。

(2)注意audio和fs的前后顺序。

总结
以上就是总结的内容啦

天启AI社区

GitCode 天启AI是一款由 GitCode 团队打造的智能助手，基于先进的LLM（大语言模型）与多智能体 Agent 技术构建，致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话，还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力，真正做到“一句话，让 Al帮你完成复杂任务”。

更多推荐