智检云SaaS服务是南京昆石网络技术有限公司和阿里云联合打造的实时高效的话务安全保障的服务体系。智检云通过语音克隆技术、语音识别技术、场景匹配技术、模糊场景匹配算法等一系列技术手段实现对于话务的实时分析,问题话务的实时告警,取代传统人工质检低效、实时性差、高成本的方式,为广大话务运营者提供高效实时,无需部署,极具性价比的话务安全保障服务。

工作原理
- 使用者升级至VOS V2.1.7.0版本后,无需其他任何软硬件部署,充值开启,即可使用。
- 系统根据使用者的设置,按比例抽取相应话务送检。通话被抽中,在不影响原媒体传输的前提下,媒体被完全克隆一份送至智检云。
- 智检云用媒体流实时推送的模式将语音交由后台进行实时的语音识别。输出结果后,与智检云海量的公共场景库及私有送检类别库中进行数据分析。
- 智检云通过自主研发的,场景匹配技术及模糊比对容错算法,判断是否应该触发告警,一旦触发告警,即可向送检VOS发起告警信息。整个处理过程是毫秒级响应速度。
智检云优势
成本优势
- 假定即使人工质检效率和机器质检效率相等,相同的成本,智智检云是人工的25倍以上的工作量。
- 仅对有效送检时长进行计费:通话小于6秒不送检,不产生成本;通话大于40秒的部分,不产生成本。
- 主、被叫媒体流可独立选择是否送检,如违法违规类业务,通常仅需抽检主叫方,从而降低成本。
- 在VOS上设计了由运营者可自主调控的任意比例抽检方式,针对全局巡检,也同时设计了针对不同的对接网关、落地网关、甚至是话机设备,进行独立的比例控制。
技术优势
- 使用者可在VOS上可自定义抽检比例,非全局送检。
- 对于小于6秒的通话不收费、通话时长超过40秒的部分也不收费。
- 若以2%为抽检值,在1-2小时之内,即可把话务完整筛选一轮。
- 与传统人工质检方式的对比,提升质检效率、高性价比。
技术难点

语音克隆技术
智检云设计之初,为能快速的搭建整个平台,曾经尝试使用最简单的先集中录音,滞后送检的方式,后期发现这种方式下对使用者来讲有许多弊端。第一,往往需要投入昂贵的成本用于额外的录音服务器的部署;第二,无法满足对话务实时监管的需求;第三,当异地部署时无法满足中心计算的要求,从而使得质检时,带宽控制变得复杂。那么,凭借着在语音转发及数据报文处理方面的优势,所研发的语音克隆技术,将报文进行了分流传输,避免了带宽被突然的满负荷占用所带来的音质波动。即使运营者在单机5000线全媒体转发,并要求全部质检的情况下,智检云服务仅占用少量的CPU及带宽资源。
云端化的SaaS能力
智检云所构筑的云端化SAAS能力,智检云投入大量的后端云服务器及相关技术手段,皆以降低客户侧的接入难度及保障使用者质检的平稳为目标,无需担心智检云后端的容量,更不用担心话务会被错检、漏检,计费错误等问题。
自动告警机制
在数万线实时分析的通话中,针对每路通话识别的结果,智检云都需要从海量的公共场景库及客户私有类别库中准确的判断该通话是否应该触发告警,所以要求这个检测判断周期必须是毫秒级,并且在这个周期内,如有告警产生,需从海量的送检用户中精准回送至该使用者平台。
展望
