走进音视频的世界——mp3封装格式
MP3,全称是MPEG Audio Layer3,利用人耳对高频声音信号不敏感的特性,结合心理声学模型,把时域信号转换为频域信号,并划分多个频段,对不同频段使用不同压缩率进行压缩。整体压缩率达到1:10,甚至1:12。...
MP3,全称是MPEG Audio Layer3,利用人耳对高频声音信号不敏感的特性,结合心理声学模型,把时域信号转换为频域信号,并划分多个频段,对不同频段使用不同压缩率进行压缩。整体压缩率达到1:10,甚至1:12。
一、MP3整体结构
MP3由ID3v2、Frame、ID3v1构成。其中,Frame表示若干音频帧。如下图所示:
二、ID3V2结构
ID3v2由标签头、扩展头、若干标签帧组成。如下表所示:
其中Frame ID由4个ASCII字节表示,如下图所示:
常见的Frame ID描述如下:
- TALB: 专辑,album
- TBPM: 节拍数,beats per minute
- TCOM: 作者,composer
- TCON: 内容类型, content type
- TCOP: 版权信息,copyright message
- TIME: 制作时间,time
- TIT1: 内容属组描述,content group description
- TIT2: 标题/歌曲名,title/SongName
- TLAN: 语言,language
三、MP3帧
MP3帧由帧头+音频数据组成。其中帧头由4个字节构成。每个字段所占bits及其描述如下:
1、version ID
版本ID由2个bits组成。其中Version1来自ISO/IEC 11172-3, Version2来自ISO/IEC 13818-3,如下图所示:
2、Bitrate Index
码率是提供索引表,根据索引下标去数据查表得到对应码率。如下图所示:
3、Samplerate Index
采样率与码率类似,也是通过索引下表去数组查表得到对应采样率。如下图所示:
四、ID3v1结构
ID3v1包括:头标识、标题、艺术家、专辑、年份、评论等。共128个字节。如下表所示:

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)