采样率、位深与好音质的标准

2025年10月27日 · 阅读需 12 分钟

当我们打开音乐平台准备购买会员时，面对 8 种不同的音质（Audio Quality）选项，该如何选择？今天我们来深入探讨音质背后的技术原理。

致谢： 本文主要内容基于「HEM Records」的视频《什么是「音质」？听歌网站的会员到底怎么选？》，在原视频基础上进行了深入解读和事实核查。感谢原作者的精彩讲解！

采样率的故事

什么是采样率？

根据奈奎斯特-香农采样定理，要完整还原一个声音信号，采样率必须至少是人耳可听频率范围的两倍。

💡 为什么必须是"两倍"?

想象一下拍电影时的车轮:

当车轮转得很慢时,摄像机能拍清楚每一帧

当车轮越转越快,超过一定速度后,你会看到车轮好像"倒着转"了!

这就是混叠现象:快速的运动被误认为是慢速甚至反向的运动

同样的道理:

如果采样速度不够快(少于 2 倍),高频声音会被"伪装"成低频声音

比如:一个快速振动的声音,可能被误认为是慢速振动

原始信息永久丢失,就像倒转的车轮无法还原真实转速

所以采样率至少要 2 倍,才能"抓住"声音的真实面貌!

人耳可听频率范围：20-20,000Hz
理论最低采样率：20,000 × 2 = 40,000Hz

按理说 40,000Hz 就足够了，但为什么最终定为 44,100Hz？

44,100Hz 的诞生：兼容电视的妥协

1980 年，索尼和飞利浦的难题

制定 CD 数字音频标准时，面临一个现实问题：必须兼容当时的电视帧率。

欧洲电视：25 帧/秒
美国电视：30 帧/秒

工程师们经过计算，找到了一个能同时兼容两种帧率的采样率：44,100Hz。

标准的力量

从此，全球音频厂商都采用这个标准：

CD 播放器
音箱
数字录音设备
音乐制作软件

数十亿设备遵循这个标准，使得 44,100Hz 一直延续至今，成为主流音乐平台的标准采样率。

48,000Hz 的诞生：DVD 时代的新标准

新问题出现

CD 标准使用约 10 年后，DVD 开始普及，电影也被刻录到光盘上。但电影的帧率是 24 帧/秒，44,100Hz 无法被整除。

工程师们又计算出一个能兼容三种帧率的采样率：48,000Hz。

无法逆转的分裂

但此时音乐行业已经全面采用 44,100Hz 标准，数十亿设备无法切换回来。这导致了今天我们看到的终极分裂：

音频平台、音乐制作软件：44,100Hz
视频平台、视频剪辑软件：48,000Hz

位深的重要性

什么是位深？

如果说采样率决定"每秒记录多少个点"，那么位深决定"这些点有多精确"。

位深相当于音频的"分辨率"，具体指能记录多小的音量。

位深与音量范围的关系

每增加 1 bit，大约可以多记录 6dB 的音频范围：

8-bit：最小音量 -48dB（背景噪音明显）
16-bit：最小音量 -96dB（人耳基本听不到噪音）
24-bit：最小音量 -144dB（完全静音）

CD 为什么选择 16-bit？

索尼和飞利浦的实验

在完全静音的录音室测试后发现：

人耳能听到的最小环境噪音约在 -100dB 到 -90dB 之间
16-bit 可以记录低至 -96dB 的声音
此精度下产生的底噪，人耳已经无法听到

为什么不选择更高的位深？

但他们没有选择 24-bit 或 32-bit，因为：

位深越高，存储空间越大
CD 容量限制（传说为了装下贝多芬第九交响曲的 74 分钟）

为什么现在推荐 24-bit？

位深更容易进化

与采样率不同，位深的提升不涉及硬件兼容性问题：

现在主要通过流媒体平台听音乐，不涉及硬件设备
增加位深只会让存储空间增加 1.5 倍
只要平台愿意承担带宽成本，音乐人就敢提高位深

当前行业现状：

音乐制作人工作时：32-bit
最终母带输出：主动降为 24-bit
主流流媒体平台：已普遍接受 24-bit

如何选择好音质？

什么是真正的好音质？

对于绝大多数听众来说，真正健康的音质需求应该是：

"让我听到和这首歌的制作人听到的一样的声音"

这个声音在 90% 的情况下只需要满足：

采样率：44,100Hz
位深：24-bit

这就是当今绝大多数母带工程师使用的最终母带格式。

根据预算的音质选择建议

预算有限

320kbps MP3 就足够了

2000 年后 MP3 压缩技术已经非常成熟
能够骗过 50% 的听众

预算充足

44,100Hz / 24-bit 无损音质

这是母带工程师自己听到的最终版本
最能还原制作人原意的声音

预算无上限

192,000Hz / 32-bit

不符合任何发行标准，需要定制
必须从录音阶段就开始监听
对应的麦克风高频捕捉范围需达到 96,000Hz
人耳上限只有 20,000Hz，相当于录制超声波
图个体验

警惕过高的参数

某些平台提供的"超清母带"（如 192,000Hz）可能存在问题：

大多数制作人使用 44,100Hz 制作
平台强行升采样到 192,000Hz
升采样容易引发各种小问题
甚至相当于替母带工程师重新做了一次母带

从文件到耳朵——音质在播放中的损失

理解了采样率和位深后，你可能会问：我下载了高品质的音频文件，就能听到高品质的声音吗？

答案是：不一定。音频文件的质量只是起点，从文件到你的耳朵，中间还有很多环节会影响最终的音质。让我们以 AirPods 听 Apple Music 为例，看看这个过程中发生了什么。

案例：AirPods + Apple Music 的音质之旅

理想情况：

Apple Music 提供 44,100Hz / 24-bit 无损音质
理论码率：44,100 × 24 × 2 = 2,116,800 bps ≈ 2,117 kbps

实际情况：

经过网络搜索验证，实际播放过程比我们想象的复杂得多：

第一步：音频文件准备好了

Apple Music 的音频文件：44,100Hz / 24-bit（音乐标准）
理论上这是高品质的无损音频

第二步：遇到了蓝牙传输的瓶颈

AirPods 使用蓝牙 AAC 编码传输
AAC 最高支持 44.1kHz 采样率，但最大码率只有 256kbps
AirPods 系统实现倾向于使用 48kHz 作为默认输出（视频标准）

第三步：系统进行了多重转换

有损压缩：iOS 系统将 2,117 kbps 的无损音频压缩为 256kbps AAC 编码

💡 256kbps 是如何计算的？

虽然 AAC 是有损压缩，但我们可以用理论计算来理解这个数字：

假设参数：

采样率：16,000Hz（AAC 压缩后的有效采样率）

位深：8-bit（压缩后的有效位深）

声道数：2（立体声）

计算过程：
码率 = 采样率 × 位深 × 声道数
   = 16,000 × 8 × 2
   = 256,000 bps
   = 256 kbps
相比之下，CD 音质的无损码率：
码率 = 44,100 × 16 × 2
   = 1,411,200 bps
   = 1,411 kbps
256kbps 只有 CD 音质的 18%！ 这就是为什么蓝牙传输无法实现真正的无损音质。

采样率转换：如果 AirPods 工作在 48,000Hz 模式，还需要将 44,100Hz 转换为 48,000Hz
潜在问题：强行升采样容易导致高频相位偏移甚至高频噪音

💡 什么是高频相位偏移？

想象两个人同时喊"一二一":

如果步调一致,声音会叠加,更响亮

如果一个喊"一"时另一个喊"二",声音会互相抵消,变小甚至消失 ****相位**就是声波的"步调"——波峰和波谷的位置。

当采样率转换时(比如 44,100Hz → 48,000Hz):

系统需要"插值"生成新的采样点

高频部分的波形容易被"算错",导致波峰波谷位置偏移

结果:高音部分可能变得模糊、失真,甚至产生刺耳的噪音

这就像把一幅画放大时,细节部分容易变形——采样率转换对高频声音的影响也是如此。

最终结果：

即使 Apple Music 提供了无损音质（2,117 kbps），通过 AirPods 蓝牙播放时，实际听到的是 256kbps AAC 有损音频，损失了大量信息。

为什么会这样？技术限制与设计选择

蓝牙传输的根本限制

蓝牙 AAC 编码本身就是瓶颈。即使采样率完美匹配，256kbps 的码率也无法传输真正的无损音质。

为什么不能同时完美支持 44.1kHz 和 48kHz？

如果要同时完美支持两种采样率，需要：

更复杂的 DSP 芯片设计 - 需要动态切换采样率
更多的功耗 - 实时采样率转换消耗电量
更复杂的固件逻辑 - 需要检测音源并自动切换
可能增加音频延迟 - 切换过程需要缓冲

但最根本的问题是：即使采样率完美匹配，256kbps 的码率也无法传输真正的无损音质。

苹果生态的矛盾

这个案例特别讽刺的地方在于，这是苹果自家产品之间的矛盾：

Apple Music 大力推广无损音质（2,117 kbps 起）
所有 AirPods 型号都不支持无损播放
即使是 AirPods Max 有线连接，也要经过 DAC 转换，无法实现真正的无损

结论：用 AirPods 听 Apple Music 的无损音质，实际上听到的仍然是 256kbps AAC 有损音频，与 Spotify 的最高音质（320kbps）差别不大。

这个案例告诉我们什么？

音频文件质量 ≠ 实际听到的音质
- 文件可能是无损的，但播放设备可能会压缩
播放链路中的每个环节都很重要
- 音频文件 → 播放器 → 传输方式 → 播放设备
- 任何一个环节的瓶颈都会影响最终音质
无线传输是当前的主要瓶颈
- 蓝牙编码的码率限制（256-320kbps）
- 远低于无损音频的要求（1,411kbps+）
有线连接仍然是追求极致音质的最佳选择
- 避免蓝牙压缩
- 避免采样率转换
- 更接近音频文件的原始质量

总结

44,100Hz 是为了兼容电视帧率而诞生的历史标准
48,000Hz 是为了兼容电影帧率，导致了音频/视频行业的分裂
24-bit 是当今音乐制作的标准位深
AirPods 的蓝牙传输是音质瓶颈，即使 Apple Music 提供无损，也会被压缩到 256kbps
好音质 = 44,100Hz / 24-bit，这是最能还原制作人原意的声音

记住：音质不仅取决于音频文件的质量，还取决于你的播放设备。选择合适的音质标准，配合好的耳机或音箱，才能真正享受音乐。

极客技巧：如何查看音频文件的参数？

如果你想亲自验证音频文件的采样率、位深和码率，可以使用 FFmpeg 工具包中的 ffprobe 命令：

ffprobe -v error -show_entries stream=sample_rate,channels,bit_rate,bits_per_raw_sample -of default=noprint_wrappers=1 your_audio_file.mp3

输出示例：

sample_rate=44100
channels=2
bit_rate=320000
bits_per_raw_sample=N/A

参数说明：

sample_rate: 采样率（Hz）
channels: 声道数（1=单声道，2=立体声）
bit_rate: 码率（bps）
bits_per_raw_sample: 原始位深（有损格式通常显示 N/A）

安装 FFmpeg：

macOS: brew install ffmpeg
Ubuntu/Debian: sudo apt install ffmpeg
Windows: 从 ffmpeg.org 下载

采样率的故事​

什么是采样率？​

44,100Hz 的诞生：兼容电视的妥协​

48,000Hz 的诞生：DVD 时代的新标准​

位深的重要性​

什么是位深？​

位深与音量范围的关系​

CD 为什么选择 16-bit？​

为什么现在推荐 24-bit？​

如何选择好音质？​

什么是真正的好音质？​

根据预算的音质选择建议​

预算有限​

预算充足​

预算无上限​

警惕过高的参数​

从文件到耳朵——音质在播放中的损失​

案例：AirPods + Apple Music 的音质之旅​

为什么会这样？技术限制与设计选择​

苹果生态的矛盾​

这个案例告诉我们什么？​

总结​

极客技巧：如何查看音频文件的参数？​

参考资料​