欢迎您光临五金加工厂,如有问题请及时联系我们。

具备AI双麦降噪功能的Voitist音旋风612正式发布,怎么看?小旋风音箱m800

作者:五金加工
文章来源:本站

  12月26日,探境科技举办“黑科技发布会”。在会上,探境科技正式公布自己的AI语音识别芯片产品矩阵,介绍其核心架构为SFA,同时,正式推出具备AI双麦降噪功能的语音识别方案即Voitist音旋风612。

  探境科技是于2022年3月成立,是一家致力于语音、图像AI芯片的AI芯片设计公司,主要提供软硬件一体化的整体方案。

  探境科技的产品主要采取SFA核心架构,这是一种面对AI芯片里存储墙的问题而设置的架构,主张以存储驱动计算。与“类CPU架构”相比,SFA架构数据访问可以降低10至100倍,同时如果在28纳米工艺条件下,SFA架构系统能效比将达到较高水平,可达4T OPS/W,计算资源利用率高,对DDR宽带的占用也会大大降低。

  探境科技CEO鲁勇称:SFA架构具有通用性,可以支持目前所有的深度学习神经网络,同时,它对神经网络参数以及数据类型没有限制。就算是没有任何经验和基础的用户也能够轻松驾驭、使用工具链。

  自2022年推出SFA架构之后,两年内,探境科技首先推出语音芯片,完成语音芯片的量产,量产超过百万,合作伙伴多达30多家,包括海尔等著名企业。而图像芯片已在2022年Q4流片成功,核心能效比可以达800 IPS/w这一高水平,同时图像芯片在一些领域已经处于盈利模式。

  2022年9月,音旋风611 开始量产,目前出货量已经超过百万,取得了不错的成绩。此次Voitist音旋风612也正是在前者的基础上,对语音识别算法,尤其是AI降噪算法、端到端算法进行了进一步的升级,为消费者提供更为优质的体验、使用效果。

  探境科技副总裁李同治表示:目前在语音研发领域,尤其是智能家居语音研究领域还存在较多问题,其中最为主要的有低音噪比、信号差、接收不及时、多声源、非稳态的噪声等问题,为此,探境科技将会通过高计算强度的神经网络、AI降噪算法以及双麦算法,解决在降噪和语音识别这两个环节的问题。

  对于语音识别产品,还有一个十分重要的问题就是如何处理信号问题。目前,传统的解决方案主要是利用麦克风阵列信号增强算法,但这一方案过度依赖声源定位、无法降低降噪比且对元件的要求极高,难以达到较高的语音识别效果和降噪效果。

  根据这一情况,探境科技则是把增强和识别进行一体化的处理,从而实现端到端的识别,同时,采用基础于神经网络的AI算法,来增强信号,提高信号的接收速度;推出端到端AI双麦算法,并将其与FCSP相结合,提高准确度。

  在这些解决方案的基础上,Voitist音旋风612将呈现更为优质、更加低噪、更为及时的语音识别效果,接下来,让我们一起拭目以待吧!

  

具备AI双麦降噪功能的Voitist音旋风612正式发布,怎么看?小旋风音箱m800

  今年2月底,探境科技发布了由低功耗系列、主打系列、旗舰系列组成的三大系列、6颗AI芯片组成的产品矩阵。其中,探境发布了具备AI双麦降噪功能的语音识别方案,即Voitist音旋风612,这也是首个离在线一体的语音识别解决方案。

  信噪比,是衡量需要识别的目标声源与其它干扰声源强度比值的对数。一般将信噪比低于15dB的称为噪声环境。信噪比越低,识别难度越大。

  

具备AI双麦降噪功能的Voitist音旋风612正式发布,怎么看?小旋风音箱m800

  在语音识别的研发过程中,一个完整的识别链路可以简化为麦克风输入、降噪处理、语音识别、识别结果输入四个环节。想做好识别,首先要在降噪处理上下功夫。

  据探境科技副总裁李同治介绍,为了验证探境AI降噪算法的有效性,他曾将一批信噪比在3dB左右的语音数据送到一个知名的云端公开语音识别引擎做了测试,降噪后比降噪前提高30%识别准确率。

  在传统的语音识别算法里,用的最多的是全连接的操作,叫DNN/DTNN。相比较于全连接操作,卷积操作能够提供更高的计算强度,且卷积运算与人类大脑负责感知模块的处理方法类似,能够提取满足大脑认知的本质特征。

  探境将其计算机视觉中的一些经验迁移到语音识别中,在语音识别算法上加入了更多的卷积操作,重新设计了一个高计算强度的神经网络,即HONN(High Operation Neural Network)。

  正是依托于AI降噪技术+HONN神经网络,探境的Voitist音旋风611,可以覆盖绝大部分的生活场景,无惧各种噪音干扰。

  为了提升低这些场景下的识别率,还需要使用麦克风阵列来增强语音信号。探境在双麦算法上有自己的独门绝技—FCSP双麦识别算法。”

  “为了克服传统分模块语音增强算法的这些缺点,我们设计出了基于FCSP的端到端AI双麦算法。”李同治对记者表示。FCSP(Frequency Complex Subspace Projection)是探境自研的频域复数子空间投影算法的简称。

  这个算法直接输入阵列信号,输出的是最终的识别结果,中间部分全部交给基于深度学习的AI算法来处理,不再使用传统的数字信号处理方法。信号增强与识别模块整体以降低识别错误率为目标进行优化,避免了语音增强与语音识别模块错配的问题。

  “端到端”是目前国际上最前沿的处理算法。通过AI语音算法+HONN神经网络模型来提升识别率,再通过FCSP“端到端”的双麦处理算法简化识别流程,降低最终识别错误率,探境的语音算法实现了跨越式的升级。

  探境自研的SFA架构,以存储驱动计算,具有能效比高、资源利用率高、通用性强等特点。在SFA架构上实现深度学习时,只需要一个较高层次的神经网络描述。SFA的编译器首先将这个神经网络进行全部融合,然后根据具体架构实现的规模产生一个统一的存储流图,再进行存储节点的时空映射,最后根据各个节点之间的计算类型配置计算单元,组合起来形成一个统一的固件供SFA控制器使用。

  在28nm常规工艺芯片的对比测试中,SFA架构在乘法器数目相同情况下,结果如下表。(DRAM为LPDDR4)。

  这意味着SFA架构所采用的各种微观和宏观调度算法,比较“类CPU架构”采用的基于总线和指令集的映射方法,在近似存储量、近似算力、近似外部存储带宽、近似功耗约束的前提下,可以获得8~12倍的利用率收益。

  “SFA(存储优先)架构是探境的产品基石,正是借助SFA的优势,我们的AI芯片产品才能‘裂变式’的推出,大大加快了探境的商业化落地速度。”探境CEO鲁勇这样评价SFA架构的意义。

  “探境不仅仅是一个语音芯片公司,而是一家语音、图像整体结合的AI芯片公司。AI芯片这一领域不像手机APP那样,瞬间可以凭一款应用获得数百万的用户,AI芯片更像马拉松长跑,比的是耐力,而不是冲刺速度,在这场比赛中,不是要看谁跑得快,而是要看谁有潜力到达终点,谁在中途不走岔路。”鲁勇向记者表示。

来源:文章来源于网络,如有侵权请联系我们删除。本文由五金加工编辑,欢迎分享本文,转载请保留出处和链接!