您当前的位置是:  首页 > 技术 > 呼叫中心 > 文摘 >
当前位置:首页 > 技术 > 呼叫中心 > 文摘 > 神州泰岳:无人值守智能客服中心

神州泰岳:无人值守智能客服中心

2017-09-21 16:17:42   作者:   来源:CTI论坛   评论:0  点击:


  由CTI论坛(www.ctiforum.com)主办的2017中国客户体验创新大会<http://www.ctiforum.com/expo/2017/awards2017/index.html>于9月14日在深圳益田威斯汀酒店盛大开幕,本次会议以"在联络中心数字化转型中抢得先机"为主题,北京神州泰岳软件股份有限公司AI大数据副总裁张瑞飞应邀出席此次会议并发表题为《无人值守智能客服中心》的主题演讲。张瑞飞介绍了泰岳无人客服方案,包括:智能机器人虚拟坐席,多轮会话,知识管理,语音质检,语义质检,场景化应用,智能IVR导航,工单机器学习,对接业务流程引擎及客服智能运维,以及同合作伙伴联合打造无人客服生态。
北京神州泰岳软件股份有限公司AI大数据副总裁张瑞飞
图:北京神州泰岳软件股份有限公司AI大数据副总裁张瑞飞

演讲PPT下载pdf格式
  张瑞飞:大家好!我接下来的半个小时给大家介绍一下神州泰岳无人值守的客服中心的解决方案。我们人工智能发展到现在到底有没有可能形成真正无人值守的客户中心的方式这是比较有争议的,最近两年我们做越来越多的工作,我们看到有越来越多轮工智能的东西在逐渐取代我们比较传统的用人来实现的操作。这些内容当它越来越多的时候,我们想是不是真的有一天有可能逐渐代替人的10%的工作量,20%,甚至50%的工作量。这样我们把人工智能技术的核心结合其他的流程技术、数据技术,把它合成在一起,跟我们的客服中心的合作伙伴在一起,我们想打造无人值守的客服中心。我们在金融和税务两个行业在进行尝试,我们发现用人工智能方式做虚拟座席和虚拟服务窗口的时候,效率和准确率超出人们比较繁琐工作流程的工作限度,减少工作时间,提高生产效率。
  简单介绍参与研究的人员,我们给这些人员做一个致谢。首先是李生教授,他是咱们国内第一个获得国际ACL国际语言协会的终身成就奖的第一个科学家,是哈工大的党委书记。也是人工智能研究院的名誉院长,是我们的首席科学家。颜永红教授是Intel做人机界面的总架构师,是中科院的科学家,主要负责语言学和声学研究部分。赵庆卫教授是中科院声学所的研究员,推出的语音识别和语音上面具体的应用场景。晋耀红博士是我们人工智能研究院的院长,是原北京师范大学的博士生导师,他在语义里面曾经参与过HAC概念层次网络的语义研究,是当时跟着中科院的团队,是研究组的组长,提出一些不同的概念分词和语义分局的方法。我们把这个方法用在现在人工智能平台里面,去构建OEC平台。蒋宏飞博士是原来阿里做训练的训练小组的专家,他在我们这边负责小富机器人的开发。这是我们的核心研究团队。
  无人值守的客服系统,传统的电话服务和无人值守的智能服务,我们想代替传统电话不足的地方,可能是用户体验和用户24小时接听电话的能力,他的感知和传统IVR繁琐的操作,我们想在其中优化的地方。我们想做智能客服,但是智能客服和无人值守的客服中心还是有一点不一样:1、智能客服没有办法有效解决口语标准化的问题。2、多轮会话的场景里面表现不好。3、不能对复杂逻辑和复杂的业务流程进行有效的诊断。4、缺乏语义纠错的能力。我们讲传统的智能客服只是在以前的客服里面部分注入人工智能的能力,并没有形成基于人工智能形成判断和形成虚拟座席的能力。
  我们的设计原则:在客服中心问答的时候,我们想做到一步到位的精确语义理解。在进行人机智能会话的时候进行自由调整,人机会话,我们设想由机器和人进行互动和回答问题的时候,无论问题涉及其他的场景或者这个问题涉及到要办的业务,比如要办理一个房贷,买保险或者申请信用卡,无论什么样的业务,我们希望在会话的过程中进行自由跳转。智能问答除了渠道界面,更需要处理业务和保留历史记忆来进行多轮会话的能力,我们在这个能力上取得一定突破,才取得无人客服的概念。
  无人客服并不是我们现在提得很新的话题,京东本身去年的时候开始尝试京东无人客服,我们这里讲和京东的区别,我们发现一些在银行或者是税务或者政府、企业里面应用的企业级客服重要需要的,不是消费型市场的客服中心需要的东西,比如我们的业务流程需要更强的定制,比如我们对个人的肖像需要更好的面向企业的管理,这是企业里面不同的,我们打造的是面向企业级大B的生产端的无人构成。技术架构,基于文本语义交互式引擎和智能语音交互式引擎,对语音系统和语义系统分别做解析。智能客服接入网关对各个业务进行各个接口,比如银行,存贷款、理财等等业务的流程接口。部署架构,我们通过语音PBX系统,进入IVR,在IVR对接无人值守客服系统,再生成语音,再和CTI系统进行交互。
  这样的会话架构里面,我们需要能够进行智能交互的引擎结构,这个和传统机器人不一样,我们分五层:知识学习、知识引擎本身的建设、问答引擎、对话引擎、场景引擎,这里面分五层进行管理,所以它不再是我们单一的机器人,只是智能问答的交互引擎,是知识构建到最上层管理的完整功能。具体的组件,包括推荐学习、地图学习、闲聊学习、场景关联、碎片化的业务能力的架构和业务要素的了解,概念的理解以及会话历史和会话间的记忆,会话和场景的关联。这里面的能力有这样几个:1、我们如何进行相关意图的学习,有时候我们的人类自然问法背后隐藏的是概念化的语义表示,比如我们说能吃多少吃多少,能吃多少吃多少,重音不同意思不同。这是结合语音和语义一起做到的。2、知识加工,如何让机器人去学习到一个业务,我们以前做机器人智能问答的时候,有一个标准问答,对应一些答案,做出扩展。一个标准问对应1200个扩展问,这个概念在现在的无人值守的客服中心里面可能要颠覆掉,首先不能以问答来理解语义和用户的业务系统。我们要有入口告诉机器人怎么学会业务知识,然后我们构建业务框架的东西,在这上面通过跟机器人的会话,首先交给一个机器人业务知识。这是传统给人工座席的培训,当我的一个人工座席来的时候,我应该讲我的业务框架和业务要素,以前的机器人是没有的,只有问答,这个不够,所以把这个补起来了。3、我们对概念归一化的讲解,我们在尝试能不能直接把问题和答案自动匹配,在银行或者在特定的应用场景里面,我们让扩展问消失,这样机器人维护过程中,我们就可以基于纯粹的人工智能的语义技术来进行维护,这种场景到底可不可能发生,我们尝试做这样的场景。我们也做了测试,最近在上海银行,我们做了两轮:一是带扩展问测试。二是把所有扩展问删掉的测试,两轮测试效果都很好。4、话题站的管理,话题记忆管理和场景管理,后面分别说。
  整个构成,无人值守的智能客服交互式架构,从知识学习到线下训练到线上的知识的发布,这是完整的框架。
  技术特色,语音识别,我们做了几个特定功能:1、如何将连续的语音能够自动转换为文字,这里面主要用到的算法是大家看到的双向LSTM的深度学习神经网络的算法,利用这个算法我们把这个速度做到比国际开源软件快5倍以上,基于WFST的语音和语音特点和句法进行整合的识别技术。通过这个实现人机交互和人人交互,准确率分别是90%和80%,我们在单台服务器处理并发语音。人机交互是手机打电话是最常见的人机交互,我们的语音进入到手机,在手机里面进行识别。人人交互是通过电信的线路来进行语音识别,他们主要的区别在于对音质的线路损耗和后台处理算法的差别。
  2、关键词的检索,对用户的敏感词、业务词、提供词和与说话人无关的词,还有支持电话、网络和互联网的自然语言的对话来进行关键词的检索,保证在讲话的时候,第一个是合规,第二个是在质检的时候有些使用。
  3、通过对语音进行语音、语速、轻重音以及语音相关概念的层次分析,通过层次分析理解基本音频,以及语调之间的相关性,这是基于语音声学特征进行分析。
  4、场景分割,我能够去定义语音的角色、场景的背景,可以把语音部分和人的身份去做自动的聚类,可以给出客服语音和用户语音相区分,即使在这两个语音相重叠的时候,客服正在回答问题,机器人正在回答问题,你好,请您按照步骤一、步骤二,这时候打断,客户语音进来了,他可以分出来客户的语音是什么、要点是什么,不会吧两个语音叠加在一起,造成含混不清。
  语音引擎突出体现几个优势:1、语音的性能优势,首先准确率上能做到80%和90%,这是语音性能上的优势。当然我们在实验室里面有时候说这不一定是很高的数据结果或者大家都差不多的数据结果,是这样的。在语音识别里面,我想大家不会说哪家的语音识别的效率会特别高或者会特别低,比如科大讯飞特别高或者特别低,都不会。我觉得关键在于我们是不是有专家在优化,给企业级或者再一个领域里面优化企业的使用场景。当你的语音引擎在使用场景上进行一系列的优化之后,它的表现在应用里面的差异特别大,这时候这是语音上面和别人的差别,我们在应用的窄领域内去聚焦和投入,去做这样的语音引擎。
  2、语音的抗噪性,对于语速的识别,准确率和语音的适应性上,都做了相关的学习和建模的技术。
  为了配合无人职守的客服中心,语义上我们做了相关的提升,主要是三个方向:1、场景化;、多轮问答。3、业务本体建模。说白了是为了使得我们的智能问答的机器人更接近予人类的操作能力。它除了能够回答问题以外,它应该还能够去干活,能够做业务,能够进行系统的录入,甚至能够办理一些简单的业务流程或者能够提示或者能够进行推销。我们定义不同的业务场景,要能基于人类的一个问题,让机器有多轮问答,引导出它整个问题。第三个是机器人要了解业务,它要进行业务的建模。
  场景,它等于业务框架+知识类型+交互方式,这就是我们实际上对场景基于语义管理的定义。我们知道一个用户有不同的业务类别,我们可以对应不同的场景。这些业务类别对用户而言,首先看到的是业务框架,对于学习的知识库而言,能够看到不同的业务框架下有不同的知识类型。在交互方式上也会看到机器人给他的表述方式是不同的,这个我们管它叫场景化。以前的机器人在过于单一的场景里面使用同一种方式,都是问答。有时候不是,营销的时候交互方式是更副文本一点,普通的时候可能交互方式适合简单的回答,这样一方面考虑机器的复杂和成本,也使得我们在不同场景下的使用变得更灵活,不同场景的答案不同。另外,以前过于强调单一的知识,这里面大家看到的FAQ的知识,像人类一样,我们有不同的知识,机器人也应该学习不同的知识。等下我举个海关的例子给大家讲列表型知识。通常我们进海关,仿真枪能不能带出海关?这时候机器人给的回答就是整个法规,一个海关的规范,但实际上如果人回答那就直接回答仿真枪不能带出海关就可以。这句话意思在列表知识型里面解析,如果以机器人不具备知识架构,永远做不到人类这样回答问题,就不能从列表中解析。这是我们想要求的让他办理业务或者做场景化所必备不同的知识能力。这三个我们叫场景定义。
  场景定义下涉及到建模,定义一个场景怎么建模,这里面引入BOT建模的方式,通过BOT框架,通过它的底层自带的概念库来满足机器人在不同场景下的表现出不同角色的能力,这是BOT概念建模。BOT就是一个业务体系或者一个图谱或者就是一个多维度的业务树,都可以。这是用户很常见的BOT的拓普图。招商银行的业务划分,业务划分是像我们培训普通座席一样,有对公业务、个人业务。对公业务、个人业务再一级一级展开。这样可以告诉他,在机器的情况下,比如我个人业务里面信用卡,它包括什么,它的知识要点应该包括业务流程、业务划分等。机器人可以在相关类别情况下进行回答,二是它可以去推测你下一个问题可能是和什么相关的,就不会在所有的问题里面随意列举,而是在业务框架里面推测,这个思维是模仿人的思维进行的。我们人回答问题的时候也是这样,属于信用卡类,问了这个,我要找信用卡相关的,我们在BOT概念树的情况下进行分析,大家可以列为一个宽表对属性的穷举,这个概念展开可以非常宽。这里面列举了涉及BOT里面很多场景,不一一解释,它的意义是一样的。基于这个我们形成框架库,我给招商银行建立BOT场景,我就可以把领域定义为整个银行领域,这个框架我可以定义为银行哪类业务框架,基金办、概念型知识或者整个银行框架或者信用卡框架,我可以把业务领域和业务框架定义下来,结果是我到别的银行的时候就可以复用。比如我到长沙银行或者基金管理公司的时候,我可以把知识进行复用。基金办理的框架(见PPT)。
  概念库,这是业务领域常涉及到的场景。这个概念不单单是以前定义的打语义标签的概念,应该还包括里面列举的,比如它的集合概念、同义概念、业务概念、敏感概念、纠错概念、停用概念、成长概念等,把复杂的概念进行处理,使我们在业务场景里,能使机器人应答更加灵活,可以更符合我去探访问题本质诉求的能力,我知道它应该从属概念的哪类,看到不同的概念进行答案的提取。在这个基础上我们再进行不同类型的知识加工,比如问答类知识,概念型知识,列表型知识和要素型知识等等。不同知识的特色,这是典型问答型知识,信用卡怎么办、信用卡如何办理,这就是问答型知识。概念型知识,信用卡主要通过访问什么方式办理,这里面提取的语义概念要素是信用卡办理,信用卡办理的方式、访问、网点等等,这些要素是被自动提取出来,提取出来以后,这句问话变得更加灵活,信用卡怎么办、信用卡该如何办理、我该如何办卡等等,这些内容将被列举成同一条知识。我们做过一个测试,刚才讲了银行里面一个基本问会对应1200个扩展问题,通过概念型知识加工,可以把问题的类别扩展类大大缩减,第一步缩减为几十条,几十条还不够,我们希望最后消除扩展问,我们拿到适当的语料训练之后,最终的目的是消除扩展问,让问题自动找答案,或者使用很少的扩展问,把机器人维护的工作降