matinal:python 读取音频文件的几种方式
由于本人研究的音频方面,一开始读取音频文件的时候就遇到了一些问题
前言
由于本人研究的音频方面,一开始读取音频文件的时候就遇到了一些问题,比如,这个函数返回的是numpy,另外一个函数返回tensor,巴拉巴拉等等问题,所以在这里做一个简单的整理。
1、wavefile.read
代码示例如下:
from scipy.io import wavfile
fs, audio = wavfile.read("0.wav")
print(type(audio))
得到的结果为:
<class 'numpy.ndarray'>
2、soundfile.read
代码示例如下:
import soundfile as sf
audio, fs = sf.read("0.wav")
print(type(audio))
得到的结果为:
<class 'numpy.ndarray'>
3、librosa.load
代码示例如下:
import librosa
audio, fs = librosa.load("0.wav")
print(type(audio))
得到的结果为:
<class 'numpy.ndarray'>
4、torchaudio.load
代码示例如下:
import torchaudio
audio, fs = torchaudio.load("0.wav")
print(type(audio))
返回的结果为:
<class 'torch.Tensor'>
需要注意的两点:
(1)wavefile、soundfile、torchaudio返回的fs是文件本身的采样率;librosa返回的fs默认22050Hz。
(2)注意audio和fs的前后顺序。
总结
以上就是总结的内容啦

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)