什么是 MP3?

2025年3月17日 | 阅读 8 分钟
What is MP3

MP3 是一项标准技术,也是一种压缩音频文件格式,代表“MPEG Audio Layer-3”,由 MPEG(动态图像专家组)开发。它是一种文件扩展名和压缩方法,用于将声音序列压缩成非常小的文件,同时与 CD 相比仍能保留音频质量。通常,MP3 文件需要更少的磁盘空间,并用于存储一首歌曲或整张 CD 的数据。计算机可以保存许多歌曲,甚至数百或数千首歌曲,因为 MP3 文件所需的存储空间非常小。有许多网站允许用户下载 MP3 文件,这些文件以“.mp3”的文件名后缀标识。

使用 Windows 操作系统的用户在其操作系统中内置了 MP3 播放器。在 20 世纪 90 年代末和 21 世纪初,高保真度和小的文件大小有助于普及数字音乐下载。一首 MP3 文件可能只需要 4 MB,而一首歌曲的下载则需要 40 MB。

在计算机和 iPod 等便携式音乐播放器上,MP3 在十多年来一直是存储音乐文件的最常见方式。尽管也使用其他文件格式进行音频压缩,但 MP3 在互联网上仍然很常见。例如,Apple 的 iTunes Store 上的歌曲使用 AAC(高级音频编码)。对于免版税压缩和流媒体,Ogg Vorbis 是一种常用的开放容器格式。MP3 文件通常是下载后播放的文件,而不是流式传输音频文件,您可以将其与任何音频播放器或其他类似产品链接。

有多种 MP3 播放器,例如 iTunes(Mac)、Winamp(PC)和 mpeg123(UNIX)。一种称为“抓轨器”(ripper)的程序用于创建 MP3 文件,它允许用户将 CD 中的文件选择性地复制到其硬盘驱动器上。然后,使用另一种称为“编码器”(encoder)的程序将选定的文件转换为 MP3 文件。然而,大多数人只是从网站或其他地方下载 MP3 文件并播放它们。

创建数字音频文件的主要目标是每秒对模拟信号进行 16 位二进制采样。CD 质量声音的每秒需要 140 万位数据,因为该信号通常在 44.1 千赫的频谱范围内传输。开发人员利用人们对声音的感知方式,并结合他们的知识,设计了一种压缩算法,该算法会减少大多数听众无法感知的声音数据。动态图像专家组(MPEG)开发了一系列音频编码标准,其中 MP3 是目前最强大的算法。

MP3 文件格式

MP3 文件包含一个标头、压缩音频和元数据。标头包含有关音频的信息。高比特率和采样率可以产生更好的音质,但也会使文件变大。MP3 元数据提供有关实际录音的信息。通常,它以 ID3 标签格式保存,该格式受大多数硬件和软件媒体播放器支持。

下载 MP3

在互联网上下载音频文件与其他文件的下载方式类似。您只需搜索包含音频文件的网站即可下载。但是,要从音频嵌入网页的网站下载 MP3 并不容易。

MP3 文件如何使用

  • 您可以在驱动器上存储成千上万甚至数百万首歌曲。
  • 通过文件共享服务,您可以即时购买或下载歌曲。
  • 您可以与其他互联网用户共享 MP3 文件。
  • 还可以创建可以在互联网上收听的播客。

MP3 的简史

1894 年,美国物理学家 Alfred M. Mayer 报告称,通过一个低频音调可以使另一个音调变得听不见。关于这一现象,Richard Ehmer 于 1959 年描述了一整套听觉曲线。

德国公司 Fraunhofer-Gesellschaft 开发了 MP3,并拥有 MP3 技术专利。1987 年,Fraunhofer Institute Integrierte Schaltungen(当时是 Fraunhofer-Gesellschaft 的一个研究中心)开始研究高质量、低比特率音频编码,并将该项目命名为 EUREKA EU147。在埃尔朗根大学,Dieter Seitzer 在传输音频文件信息过标准电话线的工作中,为编码提供了帮助。Karlheinz Brandenburg 因他是 MP3 的开发者而被誉为 MP3 之父。

1972 年,Nasir Ahmed 提出了一种称为离散余弦变换 (DCT) 的变换编码,用于有损压缩,并在 1973 年,Ahmed 与 T. Natarajan 和 K. R. Rao 共同开发了它。他们也在 1974 年公布了结果。

自 1977 年以来,他一直从事压缩方法的研究,他是一名电子学专家和数学家。1978 年,Manfred R. Schroeder 和 Bishnu S. Atal 在贝尔实验室提出了一种自适应预测编码 LPC 音频编解码器,该编解码器利用掩蔽效应,使用心理声学编码算法。1979 年,Atal 和 Schroeder 发表了一篇论文,介绍了进一步的优化。

此后,在 1987 年,J. P. Princen、A. W. Johnson 和 A. B. Bradley 遵循了早期的研究。1989 年 4 月,Fraunhofer 获得了该技术专利。根据 Brandenburg 的说法,MP3 文件格式几乎不存在。在 1991 年的修改测试中,编码器不想工作。但他们发现了并解决了编译器错误;直到那时,MP3 编解码器的第一个版本才提交。1999 年,Sub-Pop 唱片公司成为第一个在线分发其音乐为 MP3 格式的唱片公司,这在当年是一个相对不为人知的小事实。

MP3 播放器

第一个 MP3 播放器,被认为是一个“失败品”,是由 Frauenhofer 在 20 世纪 90 年代初开发的。第一个成功的 MP3 播放器 AMP MP3 Playback Engine 由 Advanced Multimedia Products 的开发者 Tomislav Uzelac 发明。不久之后,Dmitry Boldyrev 和 Justin Frankel 将 AMP 播放器移植到 Windows,创建了 Winamp;当时他们是大学学生。1998 年,Winamp 将 MP3 的成功推向了一个全新的高度,因为它成为了一个免费的 MP3 音乐播放器。

MP3 技术细节

MP3 编码器分析音频信号,并根据人类听觉感知的限制进行比较。然后,MP3 编码器根据编码器应用程序中设置的采样和采样频率的限制,尽可能多地编码有用的信息。编码过程包含几个步骤,包括:

  • 最小听觉阈值:人耳对音频的某些方面不敏感。起初,大多数音频流覆盖的频率范围是人耳可以听到的。人耳最敏感的听力范围在 2 kHz 到 4 kHz 之间,通常的听力范围在 20 Hz 到 20 kHz 之间。随着年龄增长,大多数人无法听到高于 6 kHz 的音调,因为他们的听力能力下降了。MP3 编码器可以丢弃高于或低于此范围的频率。最小听觉阈值代表了人耳感知声音的水平。低于或高于此阈值的频率将不会被感知,因此不需要对其进行编码。
  • 掩蔽效应:有两个声音;一个声音比另一个声音响亮;如果同时播放这两个声音,响亮的声音会隐藏或“掩蔽”较弱的声音。另一方面,如果两个声音在频率频谱上很接近,它们可能看起来不同。然而,如果两个声音足够清晰,它们将独立可感知。为了节省磁盘空间,检测不到的声音会从录音中被移除。这两个效应最好通过类比来理解,它们被称为时间掩蔽和听觉掩蔽。
    一只飞鸟的轮廓可能与天空不同。但是,当它经过太阳前面时,太阳的亮度会覆盖住鸟的轮廓。当它再次移动到太阳的另一侧时,鸟又变得可见。在 MP3 编码中,相同的原理应用于掩蔽效应。
  • 字节存储区:字节存储区的主要功能是为 MP3 编码器提供来自未填充帧的借用空间,以存储需要额外空间的相邻帧的数据。字节存储区通过一种空间借用概念,有助于确保数据和质量的连续流动。
  • 联合立体声:在大多数编码器中,联合立体声通常默认启用,这是一个选项。然而,它不是 MP3 编码过程的重要组成部分。启用立体声后,用户可以混合真正的立体声和单声道声音。它还有助于节省结果文件的空间,因为 MP3 格式以单声道方式编码非常低和非常高的频率。
  • 霍夫曼编码:在压缩 WAV 文件时,如果不希望丢失过多数据,就需要采用心理声学。MP3 编码过程就采用了经典的霍夫曼编码算法。

MP3 比特率

MP3 压缩格式创建的 MP3 文件产生的声音不像原始录音;因此,它是一种有损格式。MP3 编码器为了减小文件大小,必须丢失一些音频信息。无损压缩格式会保留完整的音频信息,因为它们无需牺牲任何音频信息。然而,无损压缩格式创建的文件比有损格式的文件要大。

在压缩和编码 MP3 文件时,它允许您选择要保留或丢失多少信息。此外,从同一数据源创建两个具有不同文件大小和音质的 MP3 文件是可能的。此外,用户可以通过 MP3 编码软件将文件转换为 MP3 格式时选择比特率。当用户压缩文件并选择较低的比特率时,编码器将丢弃更多信息。

有些人看不起 MP3 格式(那些追求最佳音质听音乐或寻找最佳音乐体验方式的人)。他们认为,即使是最高比特率的音质也无法与 CD 和黑胶唱片相提并论。但其他人则认为,即使 MP3 文件以 320 Kbps 的比特率编码,人耳也无法分辨其与未压缩的 CD 文件之间的区别。

撇开音质问题不谈,但毫无疑问,MP3 格式正在改变音乐。用户可以通过 eMusic 和 Amazon 等音乐服务按首购买音乐。此外,CD 时代几乎正在消失,音乐单曲变得流行,因为音乐行业正在回归本源。此外,音乐制作室的混音方式也通过 MP3 格式在改变,这引起了一些音频工程师和音乐家的关注。