首页 > 技术 > 呼叫中心 > 技术 > 语音识别与分析 > 技术文摘 > 语音识别领域的“潜行者”

语音识别领域的“潜行者”

--专访普强信息CEO何国涛、CTO李全忠

2014-06-30 16:37:29   作者:   来源:21CN股票   评论:0  点击:


  问:何先生对语音识别不同的应用领域有什么想法?

  何国涛:ASR技术可以应用在很多领域:

  ·移动互联网:尽管目前还没有明晰获利前景,但在未来却有极大的市场潜能。这块的竞争已经白热化,许多实力玩家,像百度,腾讯,科大讯飞,云之声,等等正在争斗,未来还会有更多人加入进来。

  ·企业呼叫中心:要进入这个市场,企业不仅要有领先的ASR语音识别技术,同时还要有专业知识。普强则是这个领域的佼佼者。

  ·车载导航:这个领域ASR语音识别技术是必须的。销售周期比较长,但是你一旦进入这个市场,你就拥有能做十年的客户。

  ·教育领域:要有很强的政府背景和专业知识。科大讯飞在这块有压倒性的优势。

  ·声纹识别领域:增强系统安全性能,这是今年语音识别的主要收入增长点。

  ·医疗保健领域:应用到电子病历中,可自动实现把医生的声音转换成文本。这一领域也是若干发达国家在语音识别的主要收入领域。

  由于拥有领先的语音识别技术,普强已经做好了进入这些领域的准备。普强将先锁定在企业客户这块。当我们在这个领域做到最好时,我们再继续渗透到其它版块。

  普强目前拥有:

  千语语音平台:向企业提供语音识别服务

  千语语音云平台:为手机互联网应用提供的语音识别云服务

  普强智能语音分析系统:为企业提供360度大数据分析(语音,视频,文学数据等)

  问:ASR语音识别技术有哪些难点?

  李全忠:语音识别技术要求快速,准确。语音识别目前还达不到百分百准确,达到完美的距离还很远。因为中文5千字中发音有406个,是最难辨识的语种,例如(wu),可以是吴、无、吾、梧、蜈等。同样文字各地方言发音不一,便会增加难度,所以语音辩识应用的成功关键,更倾向是专业能力。人类有眼睛,耳朵,文字来帮助识别,语音识别是只通过能“听”来完成,有限的声音数据要用来识别声音的同时也要区分不同的背景杂音,需要花时间和精力去完善核心算法和积累数据。为了使每个垂直领域达到最优的识别效果,我们都需要积累经验去适当调整算法和采集选择数据,例如为呼叫中心的电话信道建立模型与移动互联网的声学模型是不一样的。

  问:ASR技术怎么应用在智能家居设备和穿戴设备上?

  何国涛:在可穿戴设备上,语音识别技术将是必备技术之一,但是要应用ASR技术到可穿戴设备,我们首先要解决能耗问题,这类设备一般没有太多电能。

  一个成功的案例是:低功耗的语音唤醒技术。它通过只针对特定人和少数命令词的识别解决了低能耗的问题,成功应用在许多嵌入式产品中,例如:手机语音唤醒,宠物语音锁链(锁链回答宠物主人的叫唤)等。

分享到: 收藏

专题