具备语音识别功能的系统越来越多的被企业及运营商所采用, 很明显,它将提升客户服务质量从而带来很好的投资回报率。Dialogic公司通过提供独特的技术,推动业内标准的实现,及广泛的生态合作伙伴联盟成为此类业务的领先者。
领导业界标准
Dialogic公司正领导并推动语音识别领域的业界标准如VXML和SALT,这些标准提供了开放的技术接口以符合实现面向互联网工作模式的业界趋势。同时,Dialogic公司也活跃于其它相关标准组织如W3C和IETF.
语音识别应用
成本和技术复杂度一直是困绕语音识别服务发展的障碍。现在正在改变,不间断的针对性能价格比提升的投入使得语音识别技术被越来越多的广泛应用之中。无论你身处价值链的哪一部分,Dialogic的生态系统都可以提供帮助。
高质量和高性能结合所产生的具备语音识别功能的解决方案,促成了越来越多的业务模式,使得今天的人们需要考虑,应该部署一个具备语音识别功能的业务。以下为几种典型的具备语音识别功能的业务。
- 具备语音识别功能的 IVR: 语音识别可以增强IVR系统的功能,访问者可以与IVR进行交谈,而不需按键选择菜单。自动语音识别是IVR的发展方向,其中,语音门户应用已经在全球拥有很多成功案例
- 具备语音识别功能的消息服务: 具有此功能的语音信箱系统使用户不必用手按键取得语音消息,这带来很大的便利,比如在开车时
- 语音拨号: 是较早在无线语音商中部署的应用,用户可以通过直接呼叫姓名进行拨号而不必用手,这在开车时会带来很大便利
Dialogic 针对语音识别功能的技术
Dialogic 公司针对语音识别应用提供了一系列通信构建模块采用了基于开放标准的独特技术。开发者可以通过各种组合以构建符合业务要求的平台。
其中Dialogic Continuous Speech Processing (CSP)连续语音处理技术可以显著提升识别准确率并大幅减低CPU占用率。
为构建高质量,高性能的语音识别服务平台提供了坚实的基础。
以下是CSP一些关键技术特点
- 回音消除(EC): 应用于语音识别,IP电话,DTMF/Tone检测,以消除呼叫信号的杂音
- 全双工方式: 应用程序可以在每个端口同时发送和接收语音数据
- 语音能量检测(VAD): 检测触发识别的语音能量
- 打断Barge-In: 当语音能量达到识别触发值时,CSP可以自动中止在那个端口的提示音,将呼叫者的有效语音送给主机,降低了系统消耗并使用户不必等待提示音的完成
- 语音事件信号: 当语音能量达到识别触发值时,CSP可以想ASR引擎主程序发出信号
- 语音预缓存: 语音识别触发前250毫秒的语音得以保存,并转发给ASR,大幅提高了识别率。
关于CSP技术,详见:http://www.dialogic.com
Dialogic具备CSP技术的通信构建模块
表一 点击看大图