百度推新款语音识别模型,准确率飙升30%,还有三款AI语音芯片模组

 新闻资讯     |      2019-12-06 22:30

智东西(大众号:zhidxcom)
文 | Lina

智东西11月28日音讯,在百度大脑敞开日上,百度语音首席架构师贾磊推出了一款新的语音辨认模型——全名叫“根据复数CNN网络的语音增强和声学建模一体化的端到端语音辨认模型”,它与业界简直一切语音辨认方案都不相同,打破了传统远场语音辨认技能的流程,可以将语音辨认准确率进步30%以上。

百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

▲百度AI技能生态部总司理喻友平、百度语音首席架构师贾磊

在采访中,贾磊告知智东西,这款语音辨认模型是百度前后历时近一年打造的。在三年之内,跟着这一技能的不断开展老练,远场语音辨认的准确率将能抵达近场语音交互的水平,未来远场语音交互将会是干流。

百度AI技能生态部总司理喻友平则推出了三款根据百度鸿鹄语音芯片的硬件模组及开发板,以及根据智能家居、智能车载、智能IoT设备这三大场景的职业处理方案人,让智能硬件厂家更好、更快地集成AI语音才能。

百度CTO王海峰在还开场致辞中表明,现在,百度语音技能渠道每天调用量现已超越了100亿次。

一、推翻传统远场语音辨认流程,准确率进步30%

百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

贾磊表明,传统远场语音交互技能,首要要对声响进行数字信号处理(信号增强、波束生成等),接着再对其进行语音辨认,触及数字信号处理和语音辨认这两大学科。

百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

当今日百度推出的根据复数CNN网络的语音增强和声学建模一体化的端到端语音辨认模型则是一款几近推翻式的新模式,它打破了上述传统流程,以一套深度学习模型替代整个流程。

百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

这套模型可以直接输入多路麦克风信号,输出方针语音文字,参数调整只要字准确率这仅有的优化方针,不需要任何声学先验常识。

贾磊说,现在除了谷歌之外,业界一切首要玩家的语音交互都选用都是传统的方法。可是跟着辨认率抵达必定阶段,传统远场语音辨认的准确率很难再进一步进步。

百度的这款新模型调配百度鸿鹄语音芯片,可以将语音辨认准确率进步30%以上。

在采访中,贾磊告知智东西,即使设备没有搭载鸿鹄芯片,而是搭载其他传统ARM芯片,这套新模型也能让远场语音辨认、初次唤醒准确率大幅提高。

贾磊说,深度学习的下一步方向便是这种跨范畴交融的技能,现在深度学习的端到端、跨学科整合方面正在快速开展,不断对已有学科进行着推翻。

二、推出三款AI语音开发板+三大职业处理方案

百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

喻友平则在现场推出了三款根据百度鸿鹄语音芯片的硬件模组及开发板,为智能硬件厂家供给软硬一体的处理方案,让智能产品更好、更快地集成远场语音交互才能。

百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

一起,针对细分场景,喻友平还在现场推出了根据鸿鹄语音芯片的智能家居、智能车载、智能IoT设备这三大场景的处理方案。 百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

喻友平说,百度大脑敞开渠道现在是国内服务规划最大的AI敞开渠道,当时,其开发者集体超越150万(首要是企业开发者)、有228项敞开的技能才能、可以在24小时内快速集成。

而关于智能硬件来说,参加语音交互才能有三大首要难点:

1)唤醒、降噪、辨认的语音算法要求高;

2)软硬件适配杂乱、周期长;

3)硬件选型难;

而百度今日推出的三款硬件模组和三大职业处理方案正是为了处理这些问题所打造的。

三、王海峰:AI在使用场景中不断进化

百度推新款语音辨认模型,准确率飙升30%,还有三款AI语音芯片模组

百度CTO王海峰在开场致辞中表明,现在百度大脑现已敞开了200多项才能,语音才能是其间的重要方面。

百度从2010年开端进军AI语音技能,2010年头开端全面布局人工智能技能,2011年下半年开端研讨深度学习,2012年头正式立项研讨开发根据深度学习的语音技能。

王海峰表明,人工智能是用电脑计算机模拟人的才能,人类在自然环境中不断进化,人工智能也在使用场景中不断进化。

当时,算力高速开展、算法继续提高、数据不断堆集,然后推动AI技能不断进化。

一起王海峰还表明,现在,百度语音技能渠道每天调用量现已超越了100亿。

四、语音AI落地各行各业

除此之外,来自创维、瓴岳、子杰宝物、华智水稻、善行智能的百度协作伙伴也别离介绍了百度AI技能落地在家电、金融、护理、农业、智能眼镜等方面的落地。

创维AIoT研讨院产品司理李凯表明,从2017年开端,创维就和百度进行了深度协作。创维集团AIoT研讨院成立于2018年,专心于AIoT相关技能的研制与协作落地。

李凯告知智东西,现在创维的“Swaiot小维智联”AI体系的设备布置量现已突破了千万台。创维电视现在也正在推动与百度鸿鹄语音芯片的协作落地。

此外,喻友平还在现场发布了百度大脑语音公益方案,将为听障、视障、行动不便等集体供给智能产品与服务的公益安排供给免费的语音辨认、语音组成技能,并以最低价钱供给语音硬件模组。