诺基亚和芬兰坦佩雷大学团队提出了一种基于深度神经网络(DNN)的立体声编码方法,用于解决不规则麦克风阵列的空间音频捕获问题。该方法采用U-Net结构和包含平均误差、空间相关和能量保存的损失函数,能够在多声源模拟混响场景中实现优于传统双声编码器的性能。Ambisonics通常用于均匀间隔的球形麦克风阵列,而该方法则适用于任何形状的麦克风阵列,为XR设备提供更灵活的沉浸式音频捕获解决方案。团队通过添加可学习的预处理层和新型损失函数,优化了模型性能,并在实验中验证了其有效性。
2025-03-20 12:10:31来源:YiVian
诺基亚和芬兰坦佩雷大学团队提出了一种基于深度神经网络(DNN)的立体声编码方法,用于解决不规则麦克风阵列的空间音频捕获问题。该方法采用U-Net结构和包含平均误差、空间相关和能量保存的损失函数,能够在多声源模拟混响场景中实现优于传统双声编码器的性能。Ambisonics通常用于均匀间隔的球形麦克风阵列,而该方法则适用于任何形状的麦克风阵列,为XR设备提供更灵活的沉浸式音频捕获解决方案。团队通过添加可学习的预处理层和新型损失函数,优化了模型性能,并在实验中验证了其有效性。
原文链接:https://news.nweon.com/128529
来源媒体:YiVian