CTI论坛(ctiforum.com) (编译/老秦): “任何傻瓜都知道。重点是要了解。”- 艾尔伯特爱因斯坦
人工智能 (AI) 帮助实现联络中心未来的多种方式令人兴奋。而且,由于 COVID-19 最初几个月推动的数字化采用,如果这个未来现在还没有发生,那么它指日可待。
但是,无论联络中心 AI (CCAI) 发展得多么迅速,重要的是要了解它仍然与一个容易被忽视的因素--转录准确性--联系在一起。而且,对于那些负责投资客户服务 AI 未来的人来说,了解原因至关重要。
为了理解我们所说的意思,机器需要知道我们正在说的是什么
与爱因斯坦的 POV 相反,机器理解语音的能力确实归结为它们准确知道所说内容的能力。或者,更具体地说,自然语言理解 (NLU) 完全取决于给定 AI 转录构成人类语音的不同音高、口音、噪音和方言的能力。
而且,要在现代化联络中心中有所作为,需要实时了解所说的内容。
输入转录引擎,传统上,这些引擎有单独的声学、发音和语言模型,每个模型都是单独训练的。让这些模型协同工作需要大量的时间和精力。传统的转录引擎难以调整并且提供相对较低的转录准确度。然而,转录架构在过去十年中发展迅速。
当今一流的语音引擎使用统一和优化音频和语言建模的端到端 (E2E) 模型。以这种方式转录的文本现在通过多个 NLP 管道进行处理,同步工作以生成结构化数据。然后,NLU 系统会解释这些数据,以更好地理解所讲内容的意图、目标和突出部分。
具有讽刺意味的是,这种现代架构比它的前辈更简单、更准确。而且,也许最重要的是,E2E 转录引擎也更容易根据客户特定的数据进行微调。特别是在联络中心内,这意味着他们的转录准确性会随着品牌和特定产品客户交互的培训而迅速提高。 E2E 正迅速成为现代转录引擎的黄金标准,也是我们在Cresta使用的方法。
但这让我们回到了最初的观点--像Cresta所使用的那样出色的自然语言理解 (NLU) 仅与它所提供的结构化数据一样好,这与转录的质量一样好。
这意味着(反过来)实时指导帮助座席帮助客户的能力与其转录引擎的准确性有关。正如非常非爱因斯坦的谚语所说,“Garbage in, garbage out”。
测量转录准确度的行业标准
好的,那么我们如何定义"好的"转录准确度是什么?这是一个简单的问题,但回答起来有点复杂。
让我们从单词错误率 (WER) 开始,这是衡量语音到文本能力转录准确性的行业标准。 WER 的计算方法是对一段转录文本中的替换、插入和删除进行总计,然后将该数量除以实际说出的单词数。而且,与大多数技术一样,随着提供语音到文本的平台逐年改进,它们各自的 WER 下降。
例如,2018 年,领先的语音转文本平台之一的 WER 约为 30%。到 2020 年,他们的估计平均值下降到 27%。到 2021 年,也就是一年后,另一项估计将相同的 WER 定为 12%。因此,随着转录引擎的改进,"良好的转录准确性"的定义将保持不变。作为参考,今天的"现成"语音到文本产品(例如亚马逊、谷歌、IBM Watson)的平均 WER 为 25%。

重要的是要注意,就像 NLU 的"Garbage in, garbage out",WER 测量在很大程度上受到训练数据质量的影响。对于许多企业而言,针对特定业务术语的 WER 将比针对通用语言的 WER 重要得多。这就是为什么可调性如此重要的原因。
Cresta在现代转录引擎中寻找什么
综上所述,有很多方法可以衡量现代转录引擎的质量。因此,举例来说,除了我们自己的工程师在Cresta的转录引擎方面优先考虑的转录准确性之外,还有以下三个主要标准:
1. 可定制性
对于联络中心应用程序,自定义和调整转录引擎的能力至关重要。每个企业都不同,快速调整转录模型以准确检测品牌特定语言对于有效的人工智能驱动功能是必须的。这样做,可以显着提高特定客户的 WER。Cresta的专有转录方法使我们的团队能够为每个客户快速创建自定义转录模型。
2. 实时
延迟对于实时联络中心应用程序中使用的转录引擎至关重要。这是因为最初的(即非最终的)成绩单首先浮出水面,然后随着更多上下文的收集进行调整以变得更加准确。某些音频片段的最终结果可能比最初的猜测(100ms 到 500ms)需要更长的时间(500ms 到 2s 甚至更长)。延迟是Cresta实时架构的核心,允许我们在对话展开时向座席和经理呈现高度准确的转录。
3. 可集成性
最后但并非最不重要的一点是可集成性。一流的转录引擎可以接收来自许多不同来源的音频流,包括 SIPREC、Amazon Connect、直接来自座席桌面等。而且随着音频系统的不断发展,特别是随着向CCaaS和UCaaS的转变,快速且简单的集成至关重要。考虑到这一点,Cresta旨在快速集成到云和混合环境中,帮助我们兑现我们的承诺,即充当客户对话的真正智能层。
转录准确性和联络中心 AI 的未来
那么转录引擎的未来会怎样呢?在未来的某个时候,联络中心人工智能能否实现完美的转录准确性?可能不是。由于语言本身在不断地适应和发展,即使是人工转录服务也无法保持 100% 的准确率。
但 100% 的准确率并不是重点。在Cresta,我们相信 AI 的真正力量在于使用它来协助劳动力,而不是追求自动化。这意味着提供有效的实时指导和生产力能力,帮助座席提供有影响力的客户体验。
声明:版权所有 非合作媒体谢绝转载
原文网址:https://cresta.com/blog/transcription-is-critical-to-contact-center-ai/