北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

产品动态NEWS

北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

灵云语音识别技术升级,助推行业高效发展

 发布于:2026-04-14 18:18   浏览:

近日,北京捷通华声科技股份有限公司正式发布灵云语音识别 V10.2 版本。本次升级以自研大模型为核心引擎,对声学模型、语言模型、端到端解码与抗噪处理进行全链路重构,在识别准确率、复杂场景鲁棒性、响应速度与行业适配能力上实现跨越式提升,为智能客服、政务办公、金融系统、公检法笔录、会议转写等场景提供更稳定、更精准、更自然的语音 AI 能力

 

捷通华声是国内最早从事智能语音语义研究与应用的企业之一,专精特新“小巨人”企业。基于主知识产权的灵云语音识别技术,历经20余年地精心打磨,依托捷通华声完善的产学研合体系,深厚的行业案例积累,近期通过大语音模型升级语音识别技术,各方面表现始终保持行业领先

 

 
 
 
大模型深度赋能,语音识别技术架构全面革新
图片

灵云语音识别V10.2依托捷通华声多年语音技术积累与大模型训练工程化能力,将大模型的语义理解、上下文关联、泛化纠错能力深度融入 ASR 全流程。新版本采用大小模型协同推理架构:小模型负责低时延前端处理与实时解码,大模型负责语言建模、歧义消解与长文本语义校准,兼顾速度与精度。 

 

相较于传统深度学习架构,新版本在口语化表达、方言口音、专业术语、多人混讲等难点场景实现显著突破,有效降低同音错误、断句错误与漏识别率,让语音转写更贴近人类真实理解逻辑。

 
 
核心能力全面跃升,打造 “听得清、识得准、响应快” 体验
 

1.识别精度再攀新高,主流场景准确率领先 在标准普通话、清晰拾音环境下,识别准确率稳定保持行业第一梯队;针对金融、法律、医疗、政务等垂直领域,内置行业专属语言模型,专业术语识别准确率大幅提升,满足高规范、高严谨度业务需求。 

 

2.强抗噪与远场适配,复杂环境稳定可用 融合升级麦克风阵列算法、自适应降噪、回声消除与去混响技术,新版本可有效抑制空调风噪、街道噪音、会议室混响、多人背景声等干扰,支持远距离拾音与高噪音场景稳定转写,在车载、公共服务、工业、智能家居等场景表现更可靠。 

 

3.超低时延与高并发,实时交互更流畅,首包响应更快,同时做到流式支持,边说边转更跟手;底层分布式架构支持高并发、高可用部署,满足大规模呼叫中心、政务热线、云会议等海量请求场景,7×24 小时稳定运行。 

 

4.多语种与多方言覆盖,全场景兼容持续扩充普通话、英语、日语、韩语等多语种及多方言,支持中英混合识别,适配跨境办公、海外业务、多民族地区服务等需求,覆盖更广泛用户群体。

 
 
全场景落地升级,助力千行百业智能化提质增效
 

灵云语音识别以云API、私有化部署、SDK组件、一体机等多样化形态交付,支持aarch64国产芯片,支持海光、昇腾国产化加速卡,快速适配企业现有系统与业务流程:

 

智能客服与外呼:转写更准、意图更清,提升质检效率与客户满意度; 

 

政务、公检法笔录:实时转写、规范成文,缩短办案与办事流程; 

 

会议办公转写:多人讲话自动区分,快速出纪要; 

 

智能车载:远场抗噪,语音控制更灵敏。

 
 
持续技术创新,以 AI 赋能高效可信交互
 

作为国内人工智能语音技术先行者,捷通华声二十余年专注灵云全栈 AI 能力研发与产业化落地。本次语音识别升级,是公司大模型+语音技术路线的重要里程碑,标志着从 “语音转文字” 向 “语音理解与语义可信” 升级。 

 

未来,捷通华声将持续深耕语音等多模态AI技术融合,推出更贴合行业需求的产品与解决方案,以稳定、安全、可控的自研 AI 技术,助力企业数字化转型,让智能语音更懂用户、更赋价值。