北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

新闻资讯NEWS

北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

全新一代算法 灵云语音识别实现跨越式进步

 发布于:2018-09-05 15:37   浏览:

近期,捷通华声推出全新一代灵云语音识别核心引擎,识别率实现跨越式提升。目前,新一代语音识别技术已上线灵云平台(AIcloud.com),供开发者调用,并面向政企客户推出包含8k、16k版本的全新灵云语音识别能力平台。

说明: F:4.文章撰写20180905新一代语音识别技术微信图片_20180905134700.jpg

此次灵云语音识别技术的升级,是捷通华声在CTC算法的基础上,对建模单元粗粒度、模型训练方法、解码帧率进行创新优化。有效提升了语音识别引擎的执行效率、鲁棒性,增强了口音、语速适配能力,大幅提升了多人对讲、远场讲话等场景中的语音识别率。

说明: F:4.文章撰写20180905新一代语音识别技术微信图片_20180905134648.jpg

调用云端语音识别服务 就上灵云平台

新一代灵云语音识别技术已上线灵云平台,开发者可以去灵云开发者社区(aicloud.com/dev/)申请调用。

开发者将灵云语音识别SDK集成到ISO、JAVA、安卓、Windows等软件应用中后,填写申请到的灵云平台语音识别服务地址、授权信息,便可免费调用灵云平台的语音识别服务。

目前,灵云平台上的语音识别技术已服务包括打车软件、输入法、翻译APP、手机银行客户端等各类数十万应用,覆盖数亿终端用户。

灵云ASR能力平台 为政企单位提供私有、专业的语音识别能力

在提供公有云ASR能力的同时,捷通华声一直在为Callcenter、会议、公安等场景提供私有化的语音识别能力。

其中,在Callcenter 电话信道8K语音识别场景,捷通华声已服务众多大型银行客服中心、客服BPO中心,将海量语音实时转写为文字,为智能质检、智能客服、智能外呼、数据分析等提供私有云的语音识别能力。

在会议、司法、医疗等16k语音识别场景,捷通华声积累了大量声学、语言数据,分别推出了会议、审讯、医疗各科室等行业版的语音识别能力平台,为政企客户提供专业、私有、更安全的语音识别能力。

十多年来,捷通华声始终坚持核心技术自主研发。随着此次灵云语音识别技术的跨越式提升,捷通华声将为公有云开发者、政企客户提供识别率更高、更优质的语音识别能力与服务。