为了实现将通话转移成为文字的功能,首先,要将呼叫中心的语音数据进行采集,然后,将采集后的语音数据通过语音识别引擎转译成为文字。

对呼叫中心语音数据的采集,通常可以采用下面几种方式:
1、并线方式
如果呼叫中心采用的模拟中继线(普通电话线),可以采用高阻并线的方式,直接采集模拟信号,经过模数变换后形成数据流。
2、三通方式
对于数字E1中继,可通过外接一个三通设备插入到原来的E1中间,对信令和数据进行协议解析,达到采集数据流的方式。
3、抓取方式
对于IMS、SIP等IP中继,可以通过网络层抓包方式抓取SIP信令包和RTP语音包,进行解析后形成数据流。
4、接口方式
少数硬件交换设备(如东进的Keygoe系列等),本身提供了SDK开发接口,能够将语音数据给中间层(如UniMedia电话中间件),形成数据流。
5、内置方式
新型的软交换系统(如iSoftCall软交换),在内部已经具备了多通道的数据分离能力,并集成了语音识别引擎,直接提供转译好的文字,业务层可直接使用。
其中,第1、2种方式难以将话务员和客户的语音进行分离,其余三种方式一般能够有效进行通道分离。具体选取那种方式,需要集成商根据情况灵活选择。