在TWS耳机的高集成度竞赛中,单馈主动降噪与双麦通话降噪的组合已成为兼顾“听感”与“说感”的主流架构。其中,双麦克风波束成形环境噪声消除算法是决定上行通话质量的核心,它的设计必须与声学硬件、前端信号链以及单馈ANC系统深度协同。以下将从声学工程师与蓝牙嵌入式工程师的双重视角,对该系统进行逐层解构。
### 一、麦克风架构的声学布局与复用策略
在一副典型的杆式TWS耳机上,硬件工程师会布置三颗MEMS麦克风:
- **FF MIC (前馈降噪麦)**:位于耳机外侧或顶部,拾取外界环境噪声供给ANC。
- **Talk MIC (通话主麦)**:置于耳机柄底端,指向人嘴方向,负责采集近场语音。
- **Ref MIC (通话副麦/参考麦)**:通常位于耳机外侧靠上位置,拾取环境噪声作为降噪参考。
双麦ENC阵列由Talk MIC与Ref MIC构成,两者间距d通常在15~25 mm之间。这一间距是基于半波长理论与空间混叠频率的折中:d越小,差分波束的低频白噪声增益越恶化,算法上的补偿负荷越重;d过大,则超过目标频段(3.4 kHz)半波长会出现空间混叠,波束图产生栅瓣。通话主麦位于近场(嘴到麦约20~40 mm),语音满足球面波传播,产生可观的声级差与相位差,这是波束成形算法实现空间选择性的物理基础。
空间与成本的严苛限制使得**FF MIC常与双麦中的Ref MIC共用**一颗麦克风。这颗复用麦的拾音信号在ADC之后被一分为二:一路以极低群延迟送入ANC前馈滤波器链,另一路进入ENC处理流水线。对该复用通道的数模转换必须采用同步采样架构,避免两路数字流之间出现相位歪斜,否则ANC与ENC的相干噪声抵消将直接失效。
### 二、双麦克风波束成形ENC算法的信号模型与核心结构
设主麦信号为 \(x_1[n]\),副麦信号为 \(x_2[n]\),时域信号模型如下:
\[
\begin{aligned}
x_1[n] &= s[n] * h_1[n] + v_1[n] \\
x_2[n] &= s[n] * h_2[n] + v_2[n]
\end{aligned}
\]
其中 \(s[n]\)为近场语音源,\(h_1, h_2\)为对应于固定嘴部位置的近场房间冲击响应(含衍射、衰减和微小的多径),\(v_1, v_2\)为环境噪声,在低频扩散场中有较高相干性。
典型的双麦波束成形ENC采用**广义旁瓣抵消器(GSC)框架**,它包括三条支路:
**1. 固定波束成形支路(FBF)**
目的是保留近场语音,构建语音参考信号。工程上采用延迟-求和或一阶差分阵列实现指向嘴巴的心形或超心形波束。例如心形波束形成器:
\[
y_{\text{fbf}}[n] = x_1[n] - a \cdot x_2[n - \tau]
\]
延迟 \(\tau\) 补偿声波从嘴到两麦的到达时间差,系数 \(a\) 调节零陷方位。由于近场效应,语音在 \(x_1\) 中的能量显著高于 \(x_2\),因而简单的差分即可实现高效的语音增强。该支路会在低频(特别是200 Hz以下)因两路信号趋近同相相减而出现白噪声增益陡降,必须依靠后置滤波提升信噪比。
**2. 阻塞矩阵支路(BM)与自适应噪声抵消**
阻塞矩阵通常构造为 \(u[n] = x_1[n] - \hat{H} \cdot x_2[n]\),其目标是滤除语音成分,仅输出环境噪声参考。\(\hat{H}\) 是基于噪声段的相对传递函数(Relative Transfer Function, RTF)估计。随后将该噪声参考馈入自适应滤波器(常用频域NLMS),对FBF输出的残留噪声进行“二次抵消”。为防止近场语音泄漏进噪声参考引起误消(即语音被部分抵消),自适应更新须受控于语音活动检测(VAD)。VAD可基于双麦空间相干性和功率比双特征联合判决,在语音存在概率高时冻结梯度更新。
**3. 后置滤波器**
即使有自适应零陷,残留的非相干噪声与风噪仍需单通道后置滤波。引入基于双麦相干性的维纳后滤波器:
\[
G(f) = \frac{|\Phi_{x_1x_2}(f)|^2}{\Phi_{x_1x_1}(f)\Phi_{x_2x_2}(f)}
\]
结合先验信噪比估计和平滑,对FBF输出进行频域掩蔽,能有效压制扩散场噪声与混响尾部。
### 三、单馈ANC与双麦ENC的实时共融设计
当用户拨通电话,上行ENC与下行单馈ANC同时运行,两者的耦合必须从信号链路和声学层面同时切断:
- **链路隔离**:共用FF MIC的数据在DMA级复制,分别送往低延迟ANC通路和ENC通路。ANC通路内的数字滤波器(典型数百抽头FIR)会产生群延迟,不可回灌至ENC参考支路,否则会在ENC里引入有色“回声”。这要求内存与总线访问的彻底隔离。
- **声学回授**:ANC利用扬声器发出反相噪声,此时耳机壳体振动和声传导会透入Talk MIC,在通话上行流中形成“ANC诱发的噪底”。在设计时,需对通话上行通路实施自适应回声消除(特别是针对ANC频段20~1.2 kHz),或将通话模式下的ANC降噪量主动压缩6~10 dB,以减少声耦合。
- **风噪处理联动**:FF MIC往往最先受到风噪攻击。双麦ENC可通过对 \(x_2\) 的高通包络检测进行风噪判别,当湍流风噪占比大时,算法自动降阶为单麦ENC模式(仅对 \(x_1\) 做统计性降噪),同时将ANC切换至较低增益甚至通透模式,防止风致破音传导至耳内。
### 四、工程实现中的关键参数与资源优化
在蓝牙SoC上,ENC处理路径被嵌入到VoIP语音流水线中:16 kHz采样、20 ms帧长、50%重叠的FFT分析/合成。GSC自适应算法常工作在128点或256点短时傅里叶变换域,每帧计算复杂度控制在3~5 MIPS以内以匹配电池寿命要求。具体手段包括:
- 自适应滤波器采用分块频域自适应算法,通过子带步长归一化加快收敛;
- RTF估计使用平滑维纳解,并引入剂量反应式的快慢跟踪(说话者晃动、头部转向时快速跟踪,静音段锁定);
- 特征依赖的步长控制:利用双麦间的幅度平方相干性MSD作为遗忘因子,远离语音谐波峰的区域加速噪声消除;
- 配合编解码器,整体端到端延迟(声入到蓝牙包发出)控制在25~30 ms以下,避免唇音失同步。
双麦波束成形ENC的鲁棒性高度依赖声学前端一致性。量产阶段需对每对MEMS麦的幅频与相频失配进行产测线校准,将相位容差控制在±2°以内(@1 kHz),否则差分阵列的零陷深度会快速劣化。
### 五、小结与展望
单馈ANC与双麦波束成形ENC在TWS上的融合,本质上是将空间声场感知同时用于播放降噪与上行增强。这一架构用极精简的麦克风数量实现了宽频带的环境抑制,其核心突破在于近场差分波束的自适应控制以及与主动降噪链路的无感共存。随着神经波束成形(如直接在复数谱或时域波形上运行的轻量级DNN)开始进入嵌入式端侧,未来双麦ENC将有望在更极端的非稳态噪声和强混响下保持高可懂度,而声学硬件的复用与隔离设计思想仍会是所有算法落地的先决条件。
本回答由 AI 生成,内容仅供参考,请仔细甄别。