LV005-概述
一、Audio CODEC
1. 为何需要音频编解码芯片?
处理器要想“听到”外界的声音必须要把外界的声音转化为自己能够理解的“语言”,处理器能理解的就是 0 和 1,也就是二进制数据。 所以我们需要先把外界的声音转换为处理器能理解的 0 和 1,在信号处理领域,外界的声音是模拟信号,处理器能理解的是数字信号,因此这里就涉及到一个 模拟信号转换为数字信号 的过程,而完成这个功能的就是 ADC 芯片。
同理,如果处理器要向外界传达自己的“心声”,也就是放音,那么就涉及到将处理器能理解的 0 和 1 转化为外界能理解的连续变化的声音, 这个过程就是将数字信号转化为模拟信号,而完成这个功能的是 DAC 芯片。
现在我们知道了,处理器如果既想“听到”外界的声音,又想向外界传达自己的“心声”,那么就需要同时用到 DAC 和 ADC 这两款芯片。那是不是买两颗 DAC 和 ADC 芯片就行了呢?答案肯定是可以的,但是音频不单单是能出声、能听到就行。我们往往需要听到的声音动听、录进去的语音贴近真实、可以调节音效、 对声音能够进行一些处理(需要 DSP 单元)、拥有统一的标准接口,方便开发等等。将这些针对声音的各种要求全部叠加到 DAC 和 ADC 芯片上,那么就会得到一个专门用于音频的芯片,也就是音频编解码芯片,英文名字就是 Audio CODEC,所以我们在手机或者电脑的介绍中看到“CODEC”这个词语,一般说的都是 音频编解码。
既然音频 CODEC 的本质是 ADC 和 DAC,那么采样率和采样位数就是衡量一款音频 CODEC 最重要的指标。比如常见音频采样率有 8K、 44.1K、 48K、 192K 甚至 384K 和 768K,采样位数常见的有 8 位、 16 位、 24 位、 32 位。采样率和采样位数越高,那么音频 CODEC 越能真实的还原声音,也就是常说的 HIFI(High-Fidelit,翻译为“高保真”)。因此会看到高端的音频播放器都会有很高的采样率和采样位数,同样的价格也会越高。当然,实际的效果还与其他部分有关,采样率和采样位数只是其中重要的指标之一。
2. 常见音频解码芯片
2.1 WM8960
来看一款音频编解码芯片( WM8960,这个是正点原子 imx6ull-alpha 开发板上的),简单了解一下。
WM8960 是一颗由 wolfson(欧胜) 公司出品的音频编解码芯片,是一颗低功耗、高质量的立体声音频 CODEC。集成 D 类喇叭功放,每个通道可以驱动一个 1W 喇叭(8Ω )。内部集成 3 个立体声输入源,可以灵活配置,拥有一路完整的麦克风接口。 WM8960 内部 ADC 和 DAC 都为 24 位。
具体特点就不详细说了,可以看芯片手册WM8960_DS _DATASHEET。WM8960 主要就是可以直接外接喇叭, 8Ω 负载下每通道 1W、集成耳机接口、麦克风接口,采样率支持 8K、 11.025K、 12K、 16K、 22.05K、 24K、 32K、 44.1K 和 48K。整体框图如图 所示:

①、此部分是 WM8960 提供的输入接口,作为立体声音频输入源,一共提供了三路,分别为 LINPUT1/RINPUT1、 LINPUT2/RINPUT2、 LINPUT3/RINPUT3。麦克风或线路输入就连接到此接口上,这部分是需要硬件工程师重点关心的,因为音频选择从哪一路进入需要在画 PCB 的时候就应该定好。
②、此部分是 WM8960 的输出接口,比如输出给耳机或喇叭, SPK_LP/SPK_LN 用于连接左声道的喇叭,支持 1W 的 8Ω 喇叭。 SPK_RP/SPK_RN 用于连接右声道的喇叭,同样支持 1W 的 8Ω 喇叭,最后就是 HP_L/HP_R,用于连接耳机。
③、此部分是数字音频接口,用于和主控制器连接,有 5 根线,用于主控制器和 WM8960 之间进行数据“沟通”。主控制器向 WM8960 的 DAC 发送的数据, WM8960 的 ADC 向主控制传递的数据都是通过此音频接口来完成的。这个接口非常重要,是驱动开发人员需要重点关注的,此接口支持 I2S 格式。
2.2 AK4458
这里也有一款,可以作为参考:AK4458
3. 内置 codec
有一些芯片可能会内置音频的 codec,这样就可以直接直接采集音频信号,例如 RK3568 这种:
![]() | ![]() |
二、数字音频接口
1. 简介
数字音频 DAI,即 Digital Audio Interfaces。DAI 表示在板级或板间传输数字音频信号的方式。相比于模拟接口,数字音频接口抗干扰能力更强,硬件设计简单,DAI 在音频电路设计中得到越来越广泛的应用。
在传统的音频电路(图 1)中有麦克风、前置放大器、模/数转换器 ADC、数/模转换器 DAC、输出放大器,以及扬声器,它们之间使用模拟信号连接。随着技术的发展和对性能考虑,模拟电路逐渐被推到链路的两端(集成到设备内部),信号链中各集成电路间将出现更多的数字接口形式。DSP 通常都是数字接口的;换能器(Transducers, i.e. Mic & Speaker)、放大器一般而言只有模拟接口,但现在也正在逐渐集成数字接口功能。 目前,集成电路设计人员正在将换能器内的 ADC、DAC 和调制器集成到信号链一端,这样就不必在 PCB 上走任何模拟音频信号,并且减少了信号链中的器件数量。图 2 给出了一个完整数字音频接口的例子。

图 1 传统音频信号链路

图 2 数字音频信号链路
2. 传输标准
数字音频信号的传输标准包括 I2S、SAI、TDM、PDM 等。
| 总线名称 | 全称 | 应用场景 | 说明 |
| PCM | Pulse Code Modulation, 脉冲编码调制 | 传输单声道数据,通常用于 AP 处理器和通信 MODEM 之间的语音数据传输(就是双向打电话的数据),也多用于蓝牙单声道通话传输。 | 这里的 PCM 指通信协议,主要是传送语音,经常看到的其实是 PCM/TDM,和 I2S 差不多,4 根线 |
| I2S | Integrated Interchip Sound,IC 间音频 | 单组 I2S 传输双声道数据,或者多组 I2S 传输多声道数据(Nx2),I2S 只能传 2 个声道的数据 | I2S 总线兼容性最好,几乎所有的芯片都支持标准 I2S 接口 |
| TDM | Time Division Multiplexing, 时分复用 | 可以传输多达 16 路及以上音频数据,像现在最流行的语音智能音箱的 7 麦克风矩阵,一般都是用 TDM 来传的数据,同时可以传输 7 路麦克风输入和 3 路以上的音频反馈信号 | PCM 可以传多达 16 路数据,采用时分复用的方式,就是 TDM, 常见的说法其实是 PCM/TDM,网上资料多数都是两者一起出现 |
| PDM | Pulse Density Modulation, 脉冲密度调制 | 通常用于数字硅麦与 SoC 连接,一个总线可以接多个器件 | PDM 只有 2 根线 |
| Intel HDA | Intel High Definition Audio | 用于 PC 的 Audio 子系统(声卡)应用 | |
| S/PDIF | Sony/Philips Digital Interconnect Format | 是由索尼与飞利浦公司联合开发的民用数字音频接口协议,主要应用于板间长距离及需要电缆连接的场合。 | |
| Ethernet AVB | Audio Video Bridging,又称音频视频桥接技术 | AVB 是基于车载以太网通信,处理音频和视频流比较常用的一种方式。以太网音视频桥接技术(Ethernet AVB)通过在传统以太网的基础上新增一系列协议标准,能提供高质量的音视频传输服务,以支持各种多媒体应用的通信需求。Ethernet AVB 主要用于音视频信息和控制类信息的数据传输。 |
注意:在应用 PCM 音频接口传输单声道数据(如麦克风)时,其接口名称常为 PCM;双声道经常使用 I2S;而 TDM 则表示传输两个及以上声道的数据,同时区别于 I2S 特定的格式。
三、总结
音频系统大概需要关注三层内容:
| 类别 | 音频术语 | 类比解释 |
| 硬件接口 | I2S / SAI 控制器 | 快递公司(谁来送) |
| 协议 | PCM / I2S / TDM / PDM / SPDIF | 快递方式(怎么送) |
| 数据格式 | PCM / ADPCM / PDM / AC3 | 包裹内容(送什么) |
| SLOT(TDM) | 时间片/通道 | 快递车的货架格子(每格一个通道) |
参考资料:
深入解析音频编解码器(Audio CODEC):硬件、接口与驱动开发-CSDN 博客
数字音频接口(I2S, PCM/TDM, PDM)_pdm 接口-CSDN 博客
【精华贴】数字音频接口详解-I2S 接口&PCM/TDM 接口&PDM 接口_mob64ca13f53d41 的技术博客_51CTO 博客

