首页 > 以色列专区 > 江苏-以色列科技合作情况 > 计划服务 > 以色列技术供给

基于算法的创新型传声器


   发布单位:
江苏省跨国技术转移中心

          国家: 以色列
   发布时间: 2020-01-07
   行业分类: 电子信息>软件 ,电子信息>信息功能材料与器件 ,电子信息>云计算
联系电话: 86 25 85485960

项目简介: 

该项目是一款基于算法的创新型传声器,其可在典型的环境(例如拥挤的房间和汽车内)中解决语音分离难题——“鸡尾酒会问题”。其可同时捕捉活动语音信号的混合信号并处理数据,从而在输出端为每个扬声器分配一个特定的输出通道。

该项目可解决自然语言处理(NLP)的关键障碍:向语音识别引擎提供更强的语音信号,因此即使在说话人较多的情况下,仍可保持语音识别的可靠性。。

 

技术优势:

与基于DOA的波束形成器不同,该项目引入了基于位置的创新型传声器,以解决混响环境中语音增强的问题。此技术将传声器阵列聚焦在所需的声源位置,而非朝向声源的方向。通过聚焦于空间中所需的声源位置,传声器阵列可捕获直接路径和多路径。

众所周知,基于DOA的波束形成器(可捕获直接路径和多路径)的替代方案是基于声传递函数(ATF)的波束形成器。但在实际场景中,ATF与语音源和传声器的关系仍未可知。估算此类ATF是一项繁琐的任务,尤其是在发射声源不可用的情况下。

此解决方案是对基于ATF方法的改进,我们按照特定的声源,将来自阵列传声器的信号与来自参考传声器(也是阵列的一部分)的信号进行关联。上述关联有助于实时估计每个声源的空间特征,且无需访问发射的信号(不同于ATF)。在将语音信号分解成不同特征的同时,基于其各自相关联的ATF对每个特征的声源进行分离。然后对结果进行合成,产生根据其起源位置进行分离的语音信号。

Insert title here 版权所有: 江苏省对外科学技术交流中心
单位地址:中国江苏省南京市龙蟠路175号   邮政编码:210042   电话:025-85485886   邮箱:jittc@jittc.org    
技术支持:南京易管在线信息技术有限公司     苏ICP备09020522号-1     苏公网安备 32010202010230号