百度输入法日均语音请求量峰值再创新高 达6.2亿

【环球网科技综合报道】“百度研发了流式多级的截断注意力模型(SMLTA),使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。在7月3日“Baidu Create 2019”百度 AI开发者大会现场,百度首席技术官王海峰在演讲中表示。

百度语音技术部负责人高亮在现场面对百度输入法念出的一段高难度“Rap”:“你的这个新model效果比baseline好多少,探索技术的depth和scope是我们的责任,我很喜欢barrier这个词,AI的value其实就是break barrier。”这样一段复杂的中英文混合“Rap”被百度输入法顺畅地识别出来,语音输入边说边上屏,整句念完便可呈现识别结果。

据报道,2019年1月百度输入法上线中英文自由说功能。通过语音识别算法SMLTA模型,百度输入法对中文音节和英文音素混合建模,并基于海量纯中文、纯英文和中英文三类数据进行模型训练,再将中文、英文和中英混合三个语言模型并行解码,融合标点和大小写进行处理。也正是基于以上AI技术支持,百度输入法还可以支持方言自由说,方言与方言、方言与普通话混合输入免切换,精确的识别结果让语音输入不再是“普通话考试”。

截止目前,百度输入法日均语音请求量峰值已突破6.2亿次,稳坐语音输入法行业头把交椅。

从手写输入到打字输入再到AI输入,百度输入法方面透露,其正在打造融合了语音、AR、视觉、知识图谱、自然语言处理等多项AI技术的“全感官输入”体验。此前百度输入法AI探索版已上线“拍立活”、“秀场”、“凌空手写”等功能,展开了对更多输入场景的探索。百度输入法通过对场景、用户的深度洞察和在技术领域的不断创新,实现在“新交互”“新表达”“新探索”三个方面全面升级。

相关新闻

    推荐阅读