北京捷通华声科技股份有限公司 提供,语音导航,语音质检,语音识别,语音合成,语音控制,身份证识别,发票识别,ocr识别,手写识别,解决方案

北京捷通华声科技股份有限公司 提供,语音导航,语音质检,语音识别,语音合成,语音控制,身份证识别,发票识别,ocr识别,手写识别,解决方案

新闻资讯NEWS

北京捷通华声科技股份有限公司 提供,语音导航,语音质检,语音识别,语音合成,语音控制,身份证识别,发票识别,ocr识别,手写识别,解决方案

人工智能借云得善价,捷通华声蓄势待飞

 发布于:2017-02-10 10:41   浏览:
本文授权转载自:联动原素

嘉宾简介

 

张连毅,北京捷通华声科技股份有限公司董事长。1989年毕业于清华大学,1989年至1992年任职于清华大学科技开发总公司(今紫光集团),与清华大学电子工程系吴佑寿、丁晓青教授合作,共同推进中国汉字印刷体识别系统商品化进程,成绩卓著。

2000年与中国科学院声学所研究员吕士楠先生、清华电子工程系陈明博士创建北京捷通华声科技股份有限公司,致力于人工智能产业发展,2011年推出首个全方位人工智能开放平台-灵云。为推动清华人工智能学术与产业发展,发起并成立清华校友人工智能联盟;投资创建清华灵云人工智能研究中心,致力于实现“灵云科技 源自清华 服务全球”的战略发展目标。

01

 

联动原素:一开始就是准备做语音,人工智能这块。

 

张连毅:这故事很好玩,我1989年毕业就在今天的紫光集团,我们原任董事长给了我一项任务,去清华找寻可以商品化的技术。那个时候我跑遍了清华的计算机系、电子系、自动化系、精仪系寻找相关的一些技术,我们那个时候叫办公室自动化人机交互,还没有上升到这么热,那时候是一个低谷期,或者是计算机技术刚刚开始起步,计算机刚开始应用于人工智能,那会儿叫语音合成、语音识别、语义理解及机器翻译,包括OCR文字识别。那个时候在各个系里面都有国家扶持的各种项目,我那个时候就有一个感觉,把这些技术得整合起来,就像我们刚才说我认为人工智能是人的技术魔法,人想造一个和自己一样的生物体,就像我们讲的克隆人、克隆动物一样,人类一直想我能不能做一个机器人能跟我一样,这是人类的梦想。

 

但是要让一个机器像我们人一样,这很难,难在很多方面。首先,我们对自己大脑的理解就不清楚;其次,我们的计算能力得支撑起技术,并且我们的算法、每项人工智能技术背后涉及的不是单纯的计算机技术,比如说语音涉及到语言学,它跟社会科学有很大的关联,甚至有些技术跟哲学都有关,人工智能相当一部分技术是孕育在文化的基础上。但是人们很聪明,就说我一下子造不出人,我能不能让它分解,我先学习人怎么说话,就是语音合成;让机器怎样听懂人的话,就是语音识别,这些技术因此就被分割了。我那个时候是很朦胧的,我只是认为这些技术整合起来,应用起来会更好。

 

 

01

        捷通华声灵云产业生态

 

 

源于这个想法,我创办了一家公司叫文通,因为当时人工智能技术只有OCR是成熟的。后来,我和清华实验室的陈博士创业,方向定位为多种人机交互技术,而不是单一的技术。从创建之初开始,我们就锁定研究核心技术,拓展领域应用。到了2000年,也就是捷通华声的雏形,我们有了语音合成和手写识别两项技术所以从2000年开始,捷通就正式开始推广多项人工智能技术,从2011年起我们开始转型,定位为全方位人工智能技术的融合应用、融合发展。

 

02

 

联动原素:当时发展这么快,是否也与整体技术的进步有关系?

 

张连毅:与两方面有关。第一说企业,我们是很努力,方向明确,另外还能坚持。曾经一度有很多人不相信我们的方向,但是我们没有调整,更不要说是放弃我们的发展方向,这是第一点。

 

03

        人机交互形象小唐龙

 

 

 

第二个就是机遇,随着3个技术,一个是GPU的服务器和云计算,另外是大数据的产生,因为人工智能每项技术几乎都离不开大数据,过去我们收集数据难度很大,互联网、移动互联网让数据收集和海量数据聚集成为可能。就像我们想做一盘好菜,过去没有素材,巧妇难为无米之炊,而大数据给我们提供了素材。GPU服务器,还有云计算,让更多的人可以使用高性能的服务器,给我们了一个好灶台,让我们炒大锅菜变成可能。有了菜和灶台,但不同的人炒菜味道一定不一样,因为各自的方法不同,这个时候有一套方法,就是机器学习,有人叫深度学习,一般统称为机器学习。

 

这时就是天时、地利、人和。拿刚才的炒菜比喻来说,炒一道大餐,佐料有了,灶台有了,菜谱也给你了,而且告诉你什么时候,放多少多少盐,按照指导走,人工智能一下子就获得了突破。其实,更大的意义在于,你能做,我能做,他也能做,只要你具备这三个要素都能做,就不像当年在清华时,只能是仅少几个实验室能做一些研究,人工智能这几年的突飞猛进正是得益于此。

 

联动原素:清华是国内最早从事人工智能技术研究的大学,能否介绍下“灵云科技 源自清华”的战略合作?

 

张连毅:2013年,清华大学产业基金投资捷通华声,双方建立战略合作关系。2014年,北京清华工业开发研究院与捷通华声联合创建“清华灵云人工智能研究中心”。在双方的战略合作中,捷通华声将发扬清华大学在国家科技进步、国民经济建设中的强大推动力与影响力,全面推进灵云发展战略,促进提升清华大学人工智能技术在产业中的影响力,助力清华大学构建“学术超前、科研领先、产业化推广最强”的领导地位,共同实现“灵云科技 源自清华 服务全球”的战略发展规划。

 

捷通华声定位于全方位人工智能技术研究与应用,“我们只做技术,不管别人拿这些技术干出了多么惊天动地的事,我们都不会眼红,更不会去抢人家的饭碗,”张连毅如此笑言。张连毅的身上有着清华人特有的家国情怀。他认为捷通华声虽为一家民营企业,却是代表着“国家”水平的“非国家队”,他的梦想是推动人工智能技术,促进中国产业的升级与进步。

 

张连毅说,捷通本着以“技术为核心,服务为己任,技术服务生活”的企业发展理念,十几年来只做了一件事:把人工智能技术做出“中国水准”。捷通华声企业文化的精髓一是真,二是实,所以捷通华声在成长的过程中,从来没有放弃过对“什么能够真正推动产业发展”的思考,一直是脚踏实地的践行者。