您当前的位置是:  首页 > 技术 > 呼叫中心 > 文摘 >
当前位置:首页 > 技术 > 呼叫中心 > 文摘 > 捷通华声:以语音交互为核心的AI技术如何助推家电智能化升级

捷通华声:以语音交互为核心的AI技术如何助推家电智能化升级

2018-06-20 09:15:10   作者:   来源:《电器》杂志   评论:0  点击:


捷通华声:以语音交互为核心的AI技术如何助推家电智能化升级
  物联网时代,人工智能技术的融入尤其是语音交互技术,给家庭交互、客厅娱乐等带来无限可能。在当下的智能家居行业,语音基于其交互的自然性,被认为是未来人与家居交互的主要入口路径,业内普遍认为,“语音将成为入口连接各种服务,构建智家生态”。
  捷通华声凭借在人工智能领域多年的积累,依托托国内首个全方位人工智能开放平台——灵云平台,结合国内领先的灵云远场语音交互技术,以及人脸识别、声纹识别、指纹识别等技术全面赋能物联网,成功在智能电视、智能机顶盒、智能车载、智能音箱、智能机器人等众多领域实现落地应用。
  同时,行业解决方案已经在业内得到广泛认可,成功应用于新松、棠棣、木爷等几十家服务型机器人中,以及长安等众多智能车载产品中,并与乐视、小米等众多电视、空调家电厂商建立了合作。
  近日,家电行业权威杂志——《电器》杂志对捷通华声总经理武卫东进行了专题访谈,主要探讨了以语音交互技术为核心的人工智能技术如何推动智能家电发展,并对AI与家电未来的深度结合进行了展望,以下为采访整理稿。
  请简单介绍公司目前在人工智能领域的布局,尤其以语音识别、语音交互为技术核心的人工智能战略。
  通过构建人工智能开放平台的方式,深化行业应用、聚集合作伙伴,进而构建人工智能产业生态是捷通华声重要的战略布局。捷通华声在这方面很早就进行了积极的探索,2011年,捷通华声的灵云全方位人工智能开放平台就面向产业全面开放,并以“云+端”方式,为产业界提供语音合成、自然语言理解、语音识别、麦克风阵列、语音唤醒、手写识别、光学字符识别、人脸识别、声纹识别、指纹识别、数据挖掘、机器翻译等全方位人工智能能力。通过将其积累的人工智能技术开放出来,捷通华声积累了众多的合作伙伴,并服务大量的行业客户。
  以全方位人工智能技术为基石,捷通华声已经构建了完善的人工智能云服务和产品生态系统,从公有云、私有云到行业解决方案,全面赋能各行各业,努力实现“让每一家企业都拥有人工智能,让每个人都能享受到人工智能的方便与快捷”的人工智能战略。
  目前,灵云人工智能云服务及产品生态系统包括以下五大类:
  灵云云服务平台(AICloud),包含语音云、图像云、镇客服云、智能外呼云等智能方案云服务以及智能语音、智能图像等全方位AI技术云服务;
  智能物联网(AIoT),包含智能电视语音助手、智能音箱语音助手、智能车载输入法等,致力于让每个智能终端“能听会说、能思考会判断”;
  全方位人工智能能力平台(AICP),为企业提供包括灵云智能语音、智能图像、智能语义、生物特征识别等全能力私有云能力平台,客户可以灵活挑选、组合AI技术,实现企业业务、应用的智能化升级;
  人工智能联络中心(AICC),包含全渠道智能客服系统、智能外呼系统、智能语音分析系统等在内的,面向智能客户服务中心的全方位人工智能门户解决方案;
  行业智能解决方案(AIIS),包括应用于会议、司法、医疗领域的智能语音转录系统,支持文本、名片、票据、证照识别的智能图像识别系统,以及可对人脸、声纹等身份信息进行综合认证的多维生物特征识别系统等。
  在您看来人工智能目前处在怎样的发展阶段和什么样的历史位置?
  目前,人工智能已经处在了从技术快速发展到技术落地应用的阶段。例如经过十几年的发展,语音识别技术进入到自由说的状态:当人自然说话、自然表达时能够准确识别,这推动语音识别进入到实现应用的阶段。捷通华声将先进的语音交互技术成功应用与智能客服、智能外呼机器人、智能电视语音助手等产品上就是典型案例。
  但除却语音和计算机视觉领域,人工智能技术在其它领域的“落地”却并不尽如人意,拿不出一份接地气的商业落地成绩单。很多人工智能技术开发者技术很强,但面对复杂的商业应用场景时便显得有些捉襟见肘。“人工智能+行业”是人工智能落地的基础,它只有像水滴一样渗透到实体经济中,渗透到各个行业中,才能带来价值。
  如今人工智能已如当年的互联网一样,成为整个时代的引领者,其应用落地也会对各行各业带来深远影响。在未来的发展中,人工智能技术的发展还会有起伏,但不会再出现大的波澜,它已然成为一项实用的技术,正在各个领域进入实用阶段,必然会对未来带来巨大变革。
  就AI技术的发展而言,目前和家电产品是怎么结合的?能给家电行业带来哪些变化?
  目前在家电产品上应用最广泛的还是语音交互相关的AI技术,通过使用语音识别、语音合成、语义理解等技术,使家庭中静止的家居转变为能听可说会思考的智能设备,用户通过简单的语音交互便能实现家居设备的控制。
  AI技术的发展,其实改变了传统的以遥控器或手机APP进行人机交互的方式,给家电行业注入了新动能,并促使着整个家电行业进行转型升级,以更加智能化、便捷化、人性化的方式为消费者提供服务。
捷通华声:以语音交互为核心的AI技术如何助推家电智能化升级
  在诸多有可能被AI技术颠覆的领域中,家电是否有被AI赋能的需求?贵公司又是如何给家电行业带来变化和发展?
  这个需求是肯定的,特别是物联网技术的发展,我们正在进入到一个万物互联互通的时代。而与我们息息相关的家电等设备,作为一个个独立的终端,由于传统交互方式及功能的单一,亟需通过AI赋能来提升用户体验并提供额外的增值服务。
  目前捷通华声已经在和各大家电厂商合作,通过输出ASR(语音识别)、TTS(语音合成)、NLU(语义理解)等核心能力,为家电厂商提供产品智能化升级的技术保障。
  提供核心技术的同时,捷通华声也打造了智能电视语音助手、远场机顶盒语音助手、智能音箱语音助手等各类语音交互产品,从核心技术到应用产品全面赋能,从而实现让每个智能终端“能听会说、能思考会判断”。
  站在贵公司的角度,如何推动人工智能家电的发展?能为家电企业提供怎么样的技术与解决方案?
  捷通华声拥有语音识别、语音合成、语义理解、麦克风阵列技术、图像识别、人脸识别、声纹识别等12项人工智能核心技术,并在2011年率先推出了全球首个全方位人工智能开放平台——灵云平台,30多种人工智能技术SDK全部免费下载使用,为各行各业进行AI赋能。针对家电企业,我们除了提供我们的语音、语义、人脸识别、声纹识别相关的AI技术外,我们还提供智能机顶盒、智能音箱、智能家居等一整套的语音交互解决方案,并且已经在一些项目中成功落地。
  灵云智能终端解决方案的一大优势就是适应性强、可复制性强,可根据客户需要在不同设备中实现助手级的语音交互能力。例如灵云电视语音助手可快速嵌入到电视、机顶盒、广电盒子等设备中,通过蓝牙遥控器直接语音控制电视,或利用麦克阵列,直接与电视对话,轻松实现语音搜索、设备控制、天气查询等功能。助手级解决方案同样可以应用于机顶盒厂商、OTT盒子、IPTV盒子等电视盒子中,让盒子也能快速拥有语音交互能力。
捷通华声:以语音交互为核心的AI技术如何助推家电智能化升级
  贵公司目前是否和家电企业建立合作,哪些家电品类对AI技术需求更迫切?您认为哪些家电需要AI技术的加持和赋能。
  捷通华声一直和家电企业保持有密切合作,在家电品类上,例如电视、冰箱、空调等大家电及微波炉、灯具、扫地机器人等小家电都有智能化升级的需求和必要,通过结合语音识别、图像识别等AI技术,赋予家电新的交互方式,例如可以边看电视边通过图像识别下单购物,空调可以根据室内温度及用户习惯自动调节,冰箱可以根据已有食材为你搭配菜谱等等,总之,有了AI技术的加持,家电会变得越来越“懂你”。
  在AI技术具体落地方面,主要有哪些?是大数据的分析、云计算,还是主要指交互方式的变化?
  这几方面应该都有。AI技术的发展一方面的确会改变传统的交互方式,比如传统家电的按键到遥控器模式,再到手机APP控制形式,再到最近比较流行的语音交互形式,将来还可能会出现脑电波控制家电的场景;另一方面,通过与大数据、云计算技术的结合,人工智能还能够根据用户行为归纳预测并智能推荐个性化服务,例如,冰箱的鸡蛋快吃完时,它能够主动发出提醒并完成下单;每天回家前一个小时,空调就会自动启动,并调至主人习惯的温度等等。
  AI技术在实现过程中的难点主要是哪个方面?
  AI技术的发展其实是螺旋上升的一个过程,它并不完美,想要达到人们期望的效果其实是有一定难度的,一些人类简单的操作如看和听,对于机器来说并不容易,而且让机器能够像人类一样思考更是难上加难,这也是AI技术在实际落地中面临的最大挑战。
  目前来看,您如何看待,人工智能对家电的影响主要体现在交互方式的变化,语音、图像以及手势识别?未来还会有哪些变化?除了交互方式,还有哪些是AI能带给家电的?
  目前,人工智能主要改变的是家电的交互方式,用户通过语音、图像、手势等操作方式更自然地与设备进行交互,但这其实仍然依赖人去操控,而未来智能家电会根据用户行为分析,主动去提供一些个性化服务。
  除了交互方式外,AI将来甚至会改变家电的形态,例如电视机将不会再有实体设备,而是一个虚拟的立体投影,除了看电视,还兼具家庭管家、视频聊天、智能陪护等功能
  在交互方式变化的背后,有哪些革命性技术?作为人工智能技术解决方案商,贵公司能给家电企业带来什么?
  交互方式的改变,离不开语音识别、语义理解、图像识别等人工智能核心技术,而这些技术的发展其实离不开深度学习技术所带来的革命性突破。捷通华声依托与清华大学建立战略合作,拥有一大批人工智能的核心算法研究团队,目前公司所推出的12项人工智能技术均为捷通华声完全自主知识产权,全方位的开放平台为家电企业变革创新带来了新的契机。
  伴随全屋智能发展起来的还有智能音箱这一新品类,您认为在未来智能音箱在AI链条中的地位是怎样的?
  智能音箱其实目前更多是起到一个教育用户认知人工智能的作用,相较于国外流行的音乐文化,国内的大多数用户并没有在家庭中使用音箱(或音响)的习惯,而目前智能音箱的火爆,其实是人们对语音交互及智能问答等功能的好奇“尝鲜”,而在未来,智能音箱很可能会演变为家庭的智能语音助手,但是,无论未来语音助手演化成何种形态,都不会仅仅局限于现有的音箱模式之中。
  目前AI交互技术存在的问题是哪些?不完美的地方有哪些?距离真正的智能还有多远?
  AI技术存在的问题是目前并不完美,离人们的期望还存在一定差距。例如人脸识别、声纹识别等身份认证技术,虽然已经达到了很高的识别准确率,但由于应用场景的特殊性,千万分之一的错误都可能带来严重的后果。
  另外由于目前NLU技术(语义理解)的发展瓶颈,市面上大多数的智能化产品其实并不太智能,依然需要人为主动地进行操控。总之,距离真正的智能还有很远的路要走。
  您能描述一下,AI家电的使用场景和终极发展阶段的样貌。
  在未来,所有的家电将会互联互通,除了与人交互外,设备间也能进行“沟通”,家电通过学习用户行为,能够在无感知无指令的情况下为人们提供适时适宜的服务并且不会产生打扰。另外,家电设备的形态也可能会发生变化,人们将会体验到真正智能化、便捷化、人性化的家居服务。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题