董芳芳|思必驰通话降噪与语音交互解决方案( 二 )


从近两年开始,我们感受到了智能语音在TWS耳机行业越来越被关注,厂家从拒绝到接受,从基础命令到全链路对话交互的需求升级,技术也在不断迭代,思必驰作为国内专业的对话式人工智能平台公司,除了为TWS耳机厂家提供低功耗唤醒和离线命令词外,还增加了骨传导声纹、转写翻译、小语种和方言识别等技术拓展。
董芳芳|思必驰通话降噪与语音交互解决方案
文章插图

结合行业趋势,思必驰为穿戴设备提供4种差异化能力加持,分别为情境感知、智慧降噪、听感优化和智能语音。
董芳芳|思必驰通话降噪与语音交互解决方案
文章插图

情感感知:
让耳机就像我们的器官一样,可以感知我们所处的环境,感知情境的变化,从而智能的帮用户做出判断,主要支持以下四种能力,包括识别噪声等级、当前场景、本人说话的状态,以及特殊的声音事件,这些能力可以用于耳机根据情境的变化进行动态切换降噪等级,与主动降噪和通话降噪结合。
董芳芳|思必驰通话降噪与语音交互解决方案
文章插图

智慧降噪:
思必驰的通话降噪算法是基于传统信号处理+VDCNN深度神经网络模型相融合,结合芯片的加速核进行优化,在有限的资源下达到消除生活中的稳态、非稳态、瞬时和职业等噪声最佳的效果,保证更好的通话效果。
董芳芳|思必驰通话降噪与语音交互解决方案
文章插图

听感优化:
听力增强与通话降噪的差别是,通话降噪是近端收音,远端放音,即使延时200ms,远端的人是不一定感受到;而听力增强是近端收音,近端放音,如果延时大于20ms用户就会听到两个声音。思必驰实现低延时的基础上,还实现动态增益、动态降噪以及啸叫抑制三大核心算法。
智能语音:
思必驰基于行业内的主流芯片上,思必驰移植了人声检测、低功耗唤醒、骨声纹唤醒等算法,同时支持在小芯片上直接集成TTS资源,实现非固定文本的离线语音播报,耳机被语音唤醒后,可通过手机,实现方言识别、语音转写翻译、智能家居控制等功能。
董芳芳|思必驰通话降噪与语音交互解决方案
文章插图

思必驰对耳机为什么需要智能语音给出了答案,智能语音能够实现连接手机、人机交互,解放双手,另外语音帮助耳机从放音设备升级为数据采集设备。
思必驰提供全链路端到端的语音解决方案,已经完成芯片端,耳机端,APP端整体协议对接,基于行业主流的低功耗芯片,移植超低功耗的人声检测VAD和唤醒模型,支持骨传导声纹唤醒,另外基于芯片实现非固定文本的离线语音播报,一方面,通过HFP协议对接手机自带的语音助手,包括Siri和安卓系,另一方面也可以支持直接通过私有协议与客户自己的APP进行对接,通过调用思必驰云端能力,帮助耳机实现方言识别,实时转写翻译,角色分离,甚至智能家居控制等技能。无论是唤醒率的性能,还是资源占用与功耗的性能,思必驰的算法表现都非常优秀。
除此之外,为了满足更多的离线语音需求,思必驰还支持了1600词的固定和非固定的文本说法,满足耳机在离线场景下的大部分应用,最重要的资源占用极低,大部分平台均可适配。
董芳芳|思必驰通话降噪与语音交互解决方案
文章插图

近期多款搭载思必驰算法的穿戴产品已经上市,董芳芳女士还提到今年年底到明年年初还有几家爆品公司的产品进行上市。
【 董芳芳|思必驰通话降噪与语音交互解决方案】