PDM麦克风

简介
PDM代表脉冲密度调制 。然而,更好的简称是“1比特过采样音频”,因为它只不过是一个高采样率、单比特的数字系统 。如果要找一个优点的话,那就是采样率是音频CD的好几倍,且用一个适当的方式将字长从16bit减小到1bit,这将作为一个PDM系统的基础 。
大多数现代的数字音频系统使用多比特PCM(脉冲编码调制)以表征信号 。PCM有利于简化处理 。这使得信号处理的操作可以在音频流上完成,例如混合,滤波和均衡 。
PDM只用1bit来传输音频,在概念上和可实行度上比PCM更简单 。它正被普遍用在手机内将音频从麦克风传输给信号处理器 。PDM在理论上很适合这个任务,因为它带来了数字的好处,例如低噪声和免于干扰信号,且成本较低 。
这个文件将覆盖PDM的基本原理:如何生成,传输和处理 。
快速词汇表
DAC(数字模拟转换器):一个设备用来将数字化表征的信号转变成模拟量 。
LSB(最低有效位):一个数字量的最小改变 。一比特是一个二进制数字量 。
MSB(最高有效位):一个数字量的有着最高值的比特 。实际上在定点有符号数上它代表的是符号位 。
PCM(脉冲编码调制):一个系统用一系列多比特的字来表征一个被采样信号 。在音频CD中用的是这个技术 。
PDM(脉冲密度调制):一个系统用单个比特来表征一个被采样信号 。
rate:信号被采样以产生一个时间不连续的表征的速率 。
:用来表征一个采样的比特的数量 。
:一个过程,使用一个给定的字长来表征一个随机数据采样 。
:是一个像噪声的信号,在量化之前被添加以提升性能 。
:一个过程用来用来减轻数据量化的有害影响,通常是添加抖动 。
Noise :系统内由于信号内容引起的本底噪声的不受欢迎的变化 。
PCM
在我们讨论PDM之前,先回顾一下PCM,这种传统的多比特数字音频 。PCM的音频信号由一系列采样值来代表,每一个采样值的比特长度都是固定数量的 。决定系统性能有两个因素:
特别的,带宽是采样频率的一半,信噪比由(6.02N+1.76)dB(6.02N+1.76)dB给定,N是字长的比特数 。
一个未加工的16位系统的理论信噪比是 。实践中,抖动用来线性化系统和排除噪声调制;这会使信噪比降低 。使用之前的公式,一个未抖动的1比特系统的信噪比是,这对任何现实的音频工作来说都是不能接受的 。与此同时,最理想的抖动需要2个最低有效位在工作;由于1bit系统总共只有1个最低有效位,且用在音频上,因此没有给抖动留有空间 。
由于系统不能被适当地抖动,1比特的呈现乍一看似乎是行不通的 。解决方案在于对噪声整形和过采样的理解 。
噪声整形
考虑一个典型的PCM信号,比如一个用24比特表征的正弦波波形 。如何在一个系统内用1比特字长来表示这个波形呢,当这样的系统出现严重的噪声和失真问题时该如何表示?
一种方法是扔掉除了最高有效位以外的所有位,有效地阈值化零点周围的信号 。这将把正弦波转换成在过零点切换的方波 。这引入了极大的失真;事实上超过了40% 。失真的原因是系统没有被抖动 。量化总会引起错误,但在一个被抖动的系统内,错误形如一个与信号无关的本底白噪声 。在一个未被抖动或抖动不足的系统内,很多错误的形式是失真 。
因此答案不是保留最高有效位以减小到1比特 。然而我们都熟悉一个将字长减小到1比特且工作正常的例子 。这就是半色调,且已经成为了自从发明了报纸以来在打印媒体上恢复图像的基本原理 。
在半色调内,一个连续的色调图像(例如灰度图)被转换成一系列的黑点和白点 。换句话说,字长被缩短为1比特,比特的状态对应黑点或白点 。这不是靠简单的阈值化,而是将阈值化产生的错误分配到相邻的未被阈值化的点上 。这个过程被称之为误差扩散 。(有很多其他方法可用来创造半色调,此处我们不考虑 。)误差扩散对图像质量的影响是巨大的,如下: