跳到主要内容

采样率、位深与好音质的标准

· 阅读需 11 分钟

当我们打开音乐平台准备购买会员时,面对 8 种不同的音质(Audio Quality)选项,该如何选择?今天我们来深入探讨音质背后的技术原理。

致谢: 本文主要内容基于「HEM Records」的视频《什么是「音质」?听歌网站的会员到底怎么选?》,在原视频基础上进行了深入解读和事实核查。感谢原作者的精彩讲解!

采样率的故事

什么是采样率?

根据奈奎斯特-香农采样定理,要完整还原一个声音信号,采样率必须至少是人耳可听频率范围的两倍

💡 为什么必须是"两倍"?

想象一下拍电影时的车轮:

  • 当车轮转得很慢时,摄像机能拍清楚每一帧

  • 当车轮越转越快,超过一定速度后,你会看到车轮好像"倒着转"了!

  • 这就是混叠现象:快速的运动被误认为是慢速甚至反向的运动

同样的道理:

  • 如果采样速度不够快(少于 2 倍),高频声音会被"伪装"成低频声音

  • 比如:一个快速振动的声音,可能被误认为是慢速振动

  • 原始信息永久丢失,就像倒转的车轮无法还原真实转速

所以采样率至少要 2 倍,才能"抓住"声音的真实面貌!

  • 人耳可听频率范围:20-20,000Hz

  • 理论最低采样率:20,000 × 2 = 40,000Hz

按理说 40,000Hz 就足够了,但为什么最终定为 44,100Hz?

44,100Hz 的诞生:兼容电视的妥协

1980 年,索尼和飞利浦的难题

制定 CD 数字音频标准时,面临一个现实问题:必须兼容当时的电视帧率

  • 欧洲电视:25 帧/秒

  • 美国电视:30 帧/秒

工程师们经过计算,找到了一个能同时兼容两种帧率的采样率:44,100Hz

标准的力量

从此,全球音频厂商都采用这个标准:

  • CD 播放器

  • 音箱

  • 数字录音设备

  • 音乐制作软件

数十亿设备遵循这个标准,使得 44,100Hz 一直延续至今,成为主流音乐平台的标准采样率。

48,000Hz 的诞生:DVD 时代的新标准

新问题出现

CD 标准使用约 10 年后,DVD 开始普及,电影也被刻录到光盘上。但电影的帧率是 24 帧/秒,44,100Hz 无法被整除。

工程师们又计算出一个能兼容三种帧率的采样率:48,000Hz

无法逆转的分裂

但此时音乐行业已经全面采用 44,100Hz 标准,数十亿设备无法切换回来。这导致了今天我们看到的终极分裂:

  • 音频平台、音乐制作软件:44,100Hz

  • 视频平台、视频剪辑软件:48,000Hz

位深的重要性

什么是位深?

如果说采样率决定"每秒记录多少个点",那么位深决定"这些点有多精确"

位深相当于音频的"分辨率",具体指能记录多小的音量

位深与音量范围的关系

每增加 1 bit,大约可以多记录 6dB 的音频范围:

  • 8-bit:最小音量 -48dB(背景噪音明显)

  • 16-bit:最小音量 -96dB(人耳基本听不到噪音)

  • 24-bit:最小音量 -144dB(完全静音)

CD 为什么选择 16-bit?

索尼和飞利浦的实验

在完全静音的录音室测试后发现:

  • 人耳能听到的最小环境噪音约在 -100dB 到 -90dB 之间

  • 16-bit 可以记录低至 -96dB 的声音

  • 此精度下产生的底噪,人耳已经无法听到

为什么不选择更高的位深?

但他们没有选择 24-bit 或 32-bit,因为:

  • 位深越高,存储空间越大

  • CD 容量限制(传说为了装下贝多芬第九交响曲的 74 分钟)

为什么现在推荐 24-bit?

位深更容易进化

与采样率不同,位深的提升不涉及硬件兼容性问题:

  1. 现在主要通过流媒体平台听音乐,不涉及硬件设备

  2. 增加位深只会让存储空间增加 1.5 倍

  3. 只要平台愿意承担带宽成本,音乐人就敢提高位深

当前行业现状:

  • 音乐制作人工作时:32-bit

  • 最终母带输出:主动降为 24-bit

  • 主流流媒体平台:已普遍接受 24-bit

如何选择好音质?

什么是真正的好音质?

对于绝大多数听众来说,真正健康的音质需求应该是:

"让我听到和这首歌的制作人听到的一样的声音"

这个声音在 90% 的情况下只需要满足:

  • 采样率:44,100Hz

  • 位深:24-bit

这就是当今绝大多数母带工程师使用的最终母带格式。

根据预算的音质选择建议

预算有限

320kbps MP3 就足够了

  • 2000 年后 MP3 压缩技术已经非常成熟

  • 能够骗过 50% 的听众

预算充足

44,100Hz / 24-bit 无损音质

  • 这是母带工程师自己听到的最终版本

  • 最能还原制作人原意的声音

预算无上限

192,000Hz / 32-bit

  • 不符合任何发行标准,需要定制

  • 必须从录音阶段就开始监听

  • 对应的麦克风高频捕捉范围需达到 96,000Hz

  • 人耳上限只有 20,000Hz,相当于录制超声波

  • 图个体验

警惕过高的参数

某些平台提供的"超清母带"(如 192,000Hz)可能存在问题:

  1. 大多数制作人使用 44,100Hz 制作

  2. 平台强行升采样到 192,000Hz

  3. 升采样容易引发各种小问题

  4. 甚至相当于替母带工程师重新做了一次母带

从文件到耳朵——音质在播放中的损失

理解了采样率和位深后,你可能会问:我下载了高品质的音频文件,就能听到高品质的声音吗?

答案是:不一定。音频文件的质量只是起点,从文件到你的耳朵,中间还有很多环节会影响最终的音质。让我们以 AirPods 听 Apple Music 为例,看看这个过程中发生了什么。

案例:AirPods + Apple Music 的音质之旅

理想情况:

  • Apple Music 提供 44,100Hz / 24-bit 无损音质

  • 理论码率:44,100 × 24 × 2 = 2,116,800 bps ≈ 2,117 kbps

实际情况:

经过网络搜索验证,实际播放过程比我们想象的复杂得多:

第一步:音频文件准备好了

  • Apple Music 的音频文件:44,100Hz / 24-bit(音乐标准)

  • 理论上这是高品质的无损音频

第二步:遇到了蓝牙传输的瓶颈

  • AirPods 使用蓝牙 AAC 编码传输

  • AAC 最高支持 44.1kHz 采样率,但最大码率只有 256kbps

  • AirPods 系统实现倾向于使用 48kHz 作为默认输出(视频标准)

第三步:系统进行了多重转换

  1. 有损压缩:iOS 系统将 2,117 kbps 的无损音频压缩为 256kbps AAC 编码

💡 256kbps 是如何计算的?

虽然 AAC 是有损压缩,但我们可以用理论计算来理解这个数字:

假设参数:

  • 采样率:16,000Hz(AAC 压缩后的有效采样率)

  • 位深:8-bit(压缩后的有效位深)

  • 声道数:2(立体声)

计算过程:

码率 = 采样率 × 位深 × 声道数
= 16,000 × 8 × 2
= 256,000 bps
= 256 kbps

相比之下,CD 音质的无损码率:

码率 = 44,100 × 16 × 2
= 1,411,200 bps
= 1,411 kbps

256kbps 只有 CD 音质的 18%! 这就是为什么蓝牙传输无法实现真正的无损音质。

  1. 采样率转换:如果 AirPods 工作在 48,000Hz 模式,还需要将 44,100Hz 转换为 48,000Hz

  2. 潜在问题:强行升采样容易导致高频相位偏移甚至高频噪音

💡 什么是高频相位偏移?

想象两个人同时喊"一二一":

  • 如果步调一致,声音会叠加,更响亮

  • 如果一个喊"一"时另一个喊"二",声音会互相抵消,变小甚至消失 ****相位**就是声波的"步调"——波峰和波谷的位置。

当采样率转换时(比如 44,100Hz → 48,000Hz):

  • 系统需要"插值"生成新的采样点

  • 高频部分的波形容易被"算错",导致波峰波谷位置偏移

  • 结果:高音部分可能变得模糊、失真,甚至产生刺耳的噪音

这就像把一幅画放大时,细节部分容易变形——采样率转换对高频声音的影响也是如此。

最终结果:

即使 Apple Music 提供了无损音质(2,117 kbps),通过 AirPods 蓝牙播放时,实际听到的是 256kbps AAC 有损音频,损失了大量信息。

为什么会这样?技术限制与设计选择

蓝牙传输的根本限制

蓝牙 AAC 编码本身就是瓶颈。即使采样率完美匹配,256kbps 的码率也无法传输真正的无损音质。

为什么不能同时完美支持 44.1kHz 和 48kHz?

如果要同时完美支持两种采样率,需要:

  1. 更复杂的 DSP 芯片设计 - 需要动态切换采样率

  2. 更多的功耗 - 实时采样率转换消耗电量

  3. 更复杂的固件逻辑 - 需要检测音源并自动切换

  4. 可能增加音频延迟 - 切换过程需要缓冲

但最根本的问题是:即使采样率完美匹配,256kbps 的码率也无法传输真正的无损音质。

苹果生态的矛盾

这个案例特别讽刺的地方在于,这是苹果自家产品之间的矛盾:

  • Apple Music 大力推广无损音质(2,117 kbps 起)

  • 所有 AirPods 型号都不支持无损播放

  • 即使是 AirPods Max 有线连接,也要经过 DAC 转换,无法实现真正的无损

结论:用 AirPods 听 Apple Music 的无损音质,实际上听到的仍然是 256kbps AAC 有损音频,与 Spotify 的最高音质(320kbps)差别不大。

这个案例告诉我们什么?

  1. 音频文件质量 ≠ 实际听到的音质

    • 文件可能是无损的,但播放设备可能会压缩
  2. 播放链路中的每个环节都很重要

    • 音频文件 → 播放器 → 传输方式 → 播放设备

    • 任何一个环节的瓶颈都会影响最终音质

  3. 无线传输是当前的主要瓶颈

    • 蓝牙编码的码率限制(256-320kbps)

    • 远低于无损音频的要求(1,411kbps+)

  4. 有线连接仍然是追求极致音质的最佳选择

    • 避免蓝牙压缩

    • 避免采样率转换

    • 更接近音频文件的原始质量


总结

  • 44,100Hz 是为了兼容电视帧率而诞生的历史标准

  • 48,000Hz 是为了兼容电影帧率,导致了音频/视频行业的分裂

  • 24-bit 是当今音乐制作的标准位深

  • AirPods 的蓝牙传输是音质瓶颈,即使 Apple Music 提供无损,也会被压缩到 256kbps

  • 好音质 = 44,100Hz / 24-bit,这是最能还原制作人原意的声音

记住:音质不仅取决于音频文件的质量,还取决于你的播放设备。选择合适的音质标准,配合好的耳机或音箱,才能真正享受音乐。


极客技巧:如何查看音频文件的参数?

如果你想亲自验证音频文件的采样率、位深和码率,可以使用 FFmpeg 工具包中的 ffprobe 命令:

ffprobe -v error -show_entries stream=sample_rate,channels,bit_rate,bits_per_raw_sample -of default=noprint_wrappers=1 your_audio_file.mp3

输出示例:

sample_rate=44100
channels=2
bit_rate=320000
bits_per_raw_sample=N/A

参数说明:

  • sample_rate: 采样率(Hz)

  • channels: 声道数(1=单声道,2=立体声)

  • bit_rate: 码率(bps)

  • bits_per_raw_sample: 原始位深(有损格式通常显示 N/A)

安装 FFmpeg:

  • macOS: brew install ffmpeg

  • Ubuntu/Debian: sudo apt install ffmpeg

  • Windows: 从 ffmpeg.org 下载

参考资料