走进音视频的世界——mp3封装格式

MP3，全称是MPEG Audio Layer3，利用人耳对高频声音信号不敏感的特性，结合心理声学模型，把时域信号转换为频域信号，并划分多个频段，对不同频段使用不同压缩率进行压缩。整体压缩率达到1:10，甚至1:12。...

徐福记456

1780人浏览 · 2022-07-28 21:24:02

徐福记456 · 2022-07-28 21:24:02 发布

MP3，全称是MPEG Audio Layer3，利用人耳对高频声音信号不敏感的特性，结合心理声学模型，把时域信号转换为频域信号，并划分多个频段，对不同频段使用不同压缩率进行压缩。整体压缩率达到1:10，甚至1:12。

一、MP3整体结构

MP3由ID3v2、Frame、ID3v1构成。其中，Frame表示若干音频帧。如下图所示：

二、ID3V2结构

ID3v2由标签头、扩展头、若干标签帧组成。如下表所示：

其中Frame ID由4个ASCII字节表示，如下图所示：

常见的Frame ID描述如下：

TALB: 专辑，album
TBPM: 节拍数，beats per minute
TCOM: 作者，composer
TCON: 内容类型， content type
TCOP: 版权信息，copyright message
TIME: 制作时间，time
TIT1: 内容属组描述，content group description
TIT2: 标题/歌曲名，title/SongName
TLAN: 语言，language

三、MP3帧

MP3帧由帧头+音频数据组成。其中帧头由4个字节构成。每个字段所占bits及其描述如下：

1、version ID

版本ID由2个bits组成。其中Version1来自ISO/IEC 11172-3, Version2来自ISO/IEC 13818-3，如下图所示：

2、Bitrate Index

码率是提供索引表，根据索引下标去数据查表得到对应码率。如下图所示：

3、Samplerate Index

采样率与码率类似，也是通过索引下表去数组查表得到对应采样率。如下图所示：

四、ID3v1结构

ID3v1包括：头标识、标题、艺术家、专辑、年份、评论等。共128个字节。如下表所示：

参考：Declared_ID3v2_frames

GitCode 天启AI是一款由 GitCode 团队打造的智能助手，基于先进的LLM（大语言模型）与多智能体 Agent 技术构建，致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话，还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力，真正做到“一句话，让 Al帮你完成复杂任务”。

更多推荐

cover

【感知机】感知机(perceptron)学习算法例题及详解

cover

AI云原生：数智化时代AI Agent加速落地的技术基石与实践指南（THS）

cover

【AI论文】设计实验室：通过迭代检测与修正来设计幻灯片

所有评论(0)

查看更多评论

徐福记456

已为社区贡献1条内容