Aculab公司的Prosody板卡现支持说话人辨认和证实(SVI)功能。SVI技术是通过电话媒体安全访问个人信息的最经济和方便的处理方法。据此,可以开发许多实用系统,来访问敏感信息或提升现有应用系统的安全性能。SVI进一步扩大了Aculab公司的语音处理技术功能集。
这种统计技术能根据获得的人类声音信号的物理特性,利用电话里的一句言辞来证实说话人自己所声明的身份是否属实。换言之,根据个人声纹的唯一性,来验证说话人的身份。
这个基于主机的SVI算法模块,为采用Prosody数字信号处理资源卡的应用系统开发商提供了更多的功能选择。而且,SVI是免费的,证明了Aculab对电话语音市场的一贯承诺-提供性能无与伦比的语音处理产品,并凸现她的价值。
应用
Aculab的SVI技术能提升许多业务的性能,如:为公司提供安全存取Intranet/Extranet网络的方法,节省了设置PIN密码相关的费用。
采用SVI 技术的联络中心,因为省去了需人工参与的身份和密码认证步骤,有效减少了座席操作人员的工作负荷。有了SVI,座席人员可以集中精力致力于其他更有意义的任务。
通过保护个人信息获得的竞争优势,SVI技术也可以广泛应用于电信领域,如电话卡、蜂窝漫游、统一消息和自动总机等。
在旅游领域,SVI系统可以为"常旅客"交互业务带来更大的便利和个性化支持。
与Aculab语音识别一起使用
同时采用语音识别和说话人认证技术,允许应用系统根据电话用户的声音特征和说话内容来进一步提高说话人认证的可靠性。基于SVI的应用能自动检测到说话人按声纹进行身份证实的难易性,进而对说话人提问,以获得附加信息。
SVI算法功能是Aculab ASR软件的一部分,且已无缝集成在Aculab的统一API内。SVI和ASR在同一个服务器内实现,可以有效减小处理延时。请参阅Acualb技术文档"Prosody的自动语音识别(ASR)功能"(APB0024)。
可伸缩的结构
由于Prosody板卡的每个DSP能支持多个通道的处理,所以说话人证实处理的通道容量仅取决于SVI/ASR宿主服务器的处理能力。显然,采用额外的SVI/ASR服务器能进一步提高通道容量。这种结构特点有助于提高系统的灵活性,即根据需要采用一个或多个分布式SVI/ASR服务器,从分发挥Prosody DSP的处理能力。
支持的语言
SVI本身单独使用是与语言无关的。和ASR技术一起使用时,支持的语言包括:英国英语、美国英语、西班牙语、法语、意大利语、德语等。虽然在一次语音识别处理中可能不会同时涉及多种语言,这些语言的软件包还是单独提供的。目前支持的主机操作系统有:Windows XP/2000,Sun SPARC Solaris和Linux等。
硬件选择
Aculab的Prosody DSP资源卡为这个基于主机的SVI算法馈入语音信号,所以这个SVI/ASR算法模块可以和许多其他DSP资源并行使用,包括录/放音、DTMF检测和回波抵消等,确保在单一硬件平台上同时实现多样化的语音处理功能。
准确率指标
说话人证实技术的性能可由两个参数来度量:正确说话人被错误拒绝的概率和冒名顶替者被错误接受的概率。可以设置一个参数门限,确保错误拒绝和错误接受的概率相等,即所谓的"等错误概率(ERR)"。Aculab的ERR指标是4%。这个指标是用单句言辞测试得到的。如果采用约定的短语,这个ERR会更低。在通道容量方面,若采用1.9GHz主频的P4 CPU、总线速度为400MHz、具有1GB的RAM的机器,SVI可同时认证120个并发呼叫的用户。
技术特性
·说话人加入和删除
·说话人证实
·说话人辨别
·说话人自适应
·高辨别准确率
·连续监控
·可伸缩的结构
·Aculab的统一API
·免费使用
·静音检测
·回波抵消
技术优势
·调整原有的系统安全策略
·减少人员干预
·减少出错概率
·符合用户的习惯
·增强安全性
SVI和密钥机制同时使用,可以进一步增强安全性。在证实特定说话人说出特定密码的过程中,SVI系统多了一层安全防护。
Aculab公司供稿 CTI论坛编辑