1 总体要求
1.1 建设背景
呼叫中心定位的演变,对坐席服务能力和质量提出了更高的要求,需要借助新技术实现自动化洞察、分析、管理和提升
2010年~2018年,中国呼叫中心座席总规模的年复合增长率维持在15%以上;
呼叫中心将不再仅是【问题解决中心】,而要向【四个中心】演变
1.2 产品建设目标
智能质检产品采用自然语音交互技术和自然语言理解技术,将XX银行每日产生的非结构化的录音文件转译成结构化的文本数据,通过建模聚分析,为质检提供辅助支撑。
系统建设原则
系统的建设应遵循先进性、可扩展性、前瞻性、安全性、可操作性、灵活性相结合的原则。
- 先进性
系统应采用先进符合信息技术发展趋势和中国XX金融IT总体规划要求的体系架构,利用符合国际、国内标准的软硬件技术规范,适时引进成熟稳定的新的技术和IT产品,软件设计思想成熟稳定。
- 可扩展性
系统架构应能方便的支持业务功能的扩展,随着业务量的增长,应能灵活部署主机设备,以支持冗余和负载均衡,满足未来业务发展的需要。
- 前瞻性
系统建设在保持前瞻性的同时,要充分考虑需求增加和业务拓展带来的与其他平台和系统的交互问题,因此系统建设要满足与IT规划中其他平台和系统有效衔接,满足未来XX储蓄银行发展。
- 安全性
系统应采用完善的身份认证机制、分级权限管理机制保证业务操作的合法性;应对用户敏感数据进行安全存储;应制定可行的数据备份恢复策略、安全控制机制、运行管理监控和故障处理手段,保证系统稳定、安全运行。
- 可操作性
系统应为用户提供方便、友好的人机界面,菜单清晰、简洁,对于固定的输入项应提供列表选择或快捷输入方式。
- 灵活性
系统应采用模块化设计,提供全面、丰富的参数设置,能够满足导航规则要求。
2 行业解决方案
2.1 客服中心当前痛点
针对客服行业不同角色的沟通,发现客服中心每个参与角色都有通电,迫切需要完善的产品去满足不同角色的需求。
针对当前痛点问题,我们可以做什么:
- 需要引入AI技术,丰富质检手段,提高质检准确率,促进坐席服务质量提升,最终加强客户感知
- 需要支持多种数据接入方式,实现全量话务数据自动质检,确保质检结果更加公正客观
- 需要设计全流程质检,覆盖自动质检,人工抽检,复检,评分等质检场景,提升质检员工作效率,降低质检员出错率
- 需要多维度的数据分析工具,提供多样化的数据接口,辅助客服中心管理者掌握全面信息。
2.2 解决方案
智能质检产品全量接入呼叫中心对话录音数据,并依托人工智能技术(语音识别、语义理解)进行自动化处理,从人工抽检转变为全量自动质检,解决传统人工质检主观性强、效率低下,问题检出率不高的痛点。
给客户带来价值
- 提升质检覆盖率:由传统人工1%抽检→机器100%全量质检
- 提升服务质量:通过质检结果的通报改善坐席服务质量
- 行业风险规避:规范行业话术,规避银行保险等行业政策风险
- 提升用户满意度:通过用户投诉分析优化服务,提升用户
- 提升营销效率:通过分析打造标准话术,提升成功营销几率
3 主要功能
3.1 功能列表
一级菜单 | 二级菜单 | 三级菜单 | 一级功能 | ||
业务数据切换 | 数据趋势 | 数据趋势 | 常规任务top10 | ||
排序 | |||||
常规任务录音总量和命中数一览表 | |||||
规则配置 | 规则配置 | 创建规则 | |||
共享规则 | |||||
拷贝规则 | |||||
删除规则 | |||||
编辑规则 | |||||
发布规则 | |||||
规则验证 | 创建验证任务 | ||||
通话列表 | |||||
删除验证任务 | |||||
查看任务详情 | |||||
规则调优 | 模型调优 | ||||
规则分类 | 创建规则分类 | ||||
删除规则分类 | |||||
编辑规则分类 | |||||
公共条件 | 编辑公共条件 | ||||
删除功能 | |||||
查看同义词 | |||||
搜索同义词 | |||||
语义标签 | 创建语义标签 | ||||
编辑语义标签 | |||||
删除语义标签 | |||||
搜索语义标签 | |||||
智能质检 | 常规任务 | 创建常规任务 | |||
停用常规任务 | |||||
发布常规任务 | |||||
查看常规任务 | |||||
管理任务类型 | |||||
搜索常规任务 | |||||
专项任务 | 创建专项任务 | ||||
管理任务类型 | |||||
搜索常规任务 | |||||
通话列表 | |||||
删除专项质检任务 | |||||
报告下载 | 通话列表 | ||||
详情页面 | |||||
下载功能 | |||||
明细导出功能 | |||||
搜索功能 | |||||
高级搜索 | 高级搜索 | 搜索功能 | |||
维度设置 | |||||
导出功能 | |||||
文本方式展示 | |||||
交叉搜索 | 搜索功能 | ||||
维度设置 | |||||
导出功能 | |||||
评分结果展示 | |||||
录音补录 | 录音补录 | 上传录音 | |||
搜索录音 | |||||
基础配置 | 评分模板 | 评分类别 | |||
新建评分项 | |||||
编辑评分项 | |||||
搜索评分项 | |||||
删除评分项 | |||||
维度配置 | 搜索功能 | ||||
编辑维度 | |||||
智能学习 | 语义标签 | 语义标签列表展示 | |||
全体语义标签相似句导入功能 | |||||
相似句功能 | |||||
已添加的相似功能 | |||||
模型训练 | 训练功能 | ||||
效果测试 | 单句测试 | ||||
批量测试功能 | |||||
人工抽检标注 | 批量标注功能 | ||||
批量确认功能 | |||||
搜索功能 | |||||
标注历史 | 语义标签详情查看 | ||||
搜索功能 | |||||
关键词库 | 创建词库 | ||||
编辑词库 | |||||
删除词库 | |||||
搜索功能 | |||||
数据处理状态 | 数据处理状态 | 按照不同维度展示数据状态功能 |
功能架构
整个平台架构包含六层,从上到下依次是WEB应用、接口、服务、能力、数据存储、平台。
1)WEB应用:主要提供系统的功能展示,以及集成内部CBB的页面功能。
2)接口:主要通过NGINX进行软负载代理服务接口,提供RESTAPI给WEB应用使用。
3)服务:基于微服务的架构,通过注册中心实现服务的动态上下线及服务高可用,组件主要划分为录音转写、质检任务、引擎接入。
4)服务:基于微服务的架构,通过注册中心实现服务的动态上下线及服务高可用,组件主要划分为录音转写、质检任务、引擎接入。
5)存储:提供k-v缓存、非结构化数据、关系型数据以及文本文件等多种类型数据的存储。
6)平台:当前只支持基于虚拟机和物理机的部署,后续规划支持SAAS和容器化的方式。
3.2 语音分析流程
由上图可见,呼叫中心录音通过网络传输至ISA转写服务器集群中,ISA转写服务器对送入的语音进行转写、分析等过程后生成相应的结果,结果中包含了文本、场景分割、静音、语速、音量等信息。转写结果通过网络传输至数据库集群和ES全文索引集群,并进行统计和分析数据的处理。当用户需要进行检索时候,通过应用端进行建索,服务平台在数据库和ES索引中查询到结果后返回至应用端,应用端再通过专题、报表等展现形式将结果呈献给用户。
4 系统性能
当前版本对离线分析性能进行描述,在线分析后续版本更新。其中:
- 转写及建索能力,单台标配服务器(32核,64G内存)每小时处理110小时语音;
- 转写及建索能力,单台低配服务器(16核,32G内存)每小时处理70小时语音;
- 索引查询功能,单台标配服务器(32核,64G内存)每小时可从20000小时语音中进行搜索;
4.1 影响性能的因素
VoiceInsight® Express 语音分析产品为了实现最好的识别效果,采用了复杂度非常高的算法,也使用了大量的资源文件。因此VoiceInsight?Express语音分析系统的性能指标是受软件和硬件多方面因素影响的。下面将对影响合成系统性能的因素进行一些分析和说明。
语音分析系统本身的算法复杂度等因素:语音分析需要针对输入的语音进行详细的分析和挖掘,因此对CPU要求较高。
测试服务器的CPU运算能力:因为语音分析内部进行了大量的逻辑和数学运算,运行语音分析的服务器的CPU运算能力(简单可以用CPU的主频来表示)和CPU的数量,都会极大的影响识别系统的性能表现。CPU主频越高,数量越多,识别系统的性能越高;
内存:语音分析系统在服务的过程中,使用了大量的内存进行中间数据的存贮,并且内存中的数据进行了非常频繁的操作和计算,因此内存的可用大小和存取速度对识别系统的性能也有显着的影响,如果内存容量低于要求的大小,语音分析系统不能表现出最佳的性能;内存的存取速度越快,语音分析系统的性能也会越好。VoiceInsight?Express建议运行的服务器配置至少32G的内存,推荐配置64G的内存,PC的内存至少2G的内存,推荐配置4G。
操作系统:不同的操作系统对进程和线程的调度、内存管理、网络服务等方面的实现都存在差异。因此科大讯飞公司建议在大规模的语音分析服务应用中使用服务器版操作系统推荐为linuxsuse11/redhat6.5.
硬盘:因为识别系统需要频繁的与硬盘交换数据,因此硬盘的随机访问速度也会对识别性能造成影响。建议客户在使用语音分析服务的计算机上配置转速高于7200转的IDE硬盘或者使用高速的SCSI硬盘。
网络环境:在通过网络调用实现远程语音分析服务的应用中,网络环境的配置也会极大地影响识别系统的性能表现。在一台并发运行70路以上语音分析服务的计算机上,其网络交换的数据量会达到几十兆bps甚至更高。因此建议服务端和客户端都配置1000Mbps以上的网卡,并且最好都在同一个局域网内。另外强烈建议使用交换速率和带宽更高的1000Mbps网络交换机,而不是1000Mbps的集线器。如果局域网带宽为10Mbps,语音分析网络服务的效率会极大地受到限制。
4.2 配置要求
根据实际情况确定。
5 科大讯飞简介
科大讯飞是领先的专业语音技术提供商,拥有自主知识产权的智能语音技术代表了世界最高水平,并始终引领和不懈推动语音产业的发展。2008年,科大讯飞在深圳证券交易所挂牌上市,股票代码:002230.
科大讯飞在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别和口语评测等多项技术上拥有国际领先的成果。科大讯飞是我国唯一以语音技术为产业化方向的”国家863计划成果产业化基地“、”国家规划布局内重点软件企业“、”国家火炬计划重点高新技术企业“、”国家高技术产业化示范工程“,并被信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。2003年,科大讯飞获迄今中国语音产业唯一的”国家科技进步奖“,2005年获中国信息产业自主创新最高荣誉”信息产业重大技术发明奖“。连续六届在英文语音合成国际大赛(Blizzard Challenge)中蝉联大赛第一名。在2008年由NIST(美国国家标准技术研究院)举办的国际说话人识别评测大赛上,科大讯飞语音实验室送评的识别系统获得综合指标第一名。
语音识别和语音合成技术让信息设备与系统“能听会说”,实现人机语音交互,使人与机器之间沟通变得像人与人沟通一样高效、自然。智能语音技术有着非常广阔的应用前景。科大讯飞是中文语音技术市场的领导者,在电信、金融、能源、交通、政府等主流行业的份额达到80%以上。
- 国家863计划成果产业化基地
- 国家规划布局内重点软件企业
- 国家火炬计划重点高新技术企业
- 国家高技术产业化示范工程基地
- 国家级优秀软件企业
- 中国电子政务IT100强企业
- 中国中文语音交互技术标准工作组组长
- 国家博士后科研工作站
- 如果您想了解更多信息,敬请访问http://www.iflytek.com。