为了这个目标,微软已经努力了很久。几年前微软推出了“Windows for Pen Computing”, 但在经历过多次尝试后以失败告终;两年前,微软又提出了“Tablet PC”的概念;不久前,微软联合几大知名硬件厂商推出了实质性的产品。如此种种,足以表明已在操作系统领域处于领导地位的微软正朝Natural Computing步步逼近。
在此过程中,困扰微软最大的问题是自然语言的识别技术,包括文字输入、语音输入等技术。在智能识别技术上,微软并不占据领先地位。目前在语音输入和中文手写输入占据领导地位的分别是IBM和中国的汉王公司,微软要想抢占智能输入的制高点就必须向这两家公司发起挑战。
智能输入和识别的未来
智能识别到底有何魅力,使得计算机软件领域的首席代表如此尴尬不已?
人与计算机的交互一直是困扰厂商和用户的一个难题。随着技术的不断发展,人机交互日臻完美已经不再停留在各种构想的可行性讨论阶段,结合计算机系统和生物系统,人们构想的各种交互方式已经成为可能。
试想一下,当我们手中的钢笔成为最常用的输入设备,成为替代软盘的存储介质时,你有什么样的感慨?生活真的可以如此方便简单,它可以比传统台式和笔记本计算机更迅速快捷地记录下我们思维中瞬间的闪光点。
尽管人机交互的探讨一直没有定论,但是“语音加笔输入”的输入方式必是未来的人机界面的发展趋势。随着信息技术的发展,人们正在逐渐摆脱线缆和体积的束缚,对于任何需要交互的设备来说,信息输入都是必不可少的,而语音和笔输入无疑是最理想的输入方式。
目前在智能终端设备上,手写输入已经全面普及。中高端掌上电脑基本上都具备了手写输入的功能;具备手写输入功能的智能手机也不断面市,如索尼和爱立信联合推出的P802手机,多普达推出的Pocket PC手机等都可成为见证。
而语音输入在我们的日常家居中更为普遍。采用语音输入的基于嵌入式操作系统的智能家居设备已经走出了实验室;通过语音来控制家里的家电如灯光的亮度、空调的开关都已经成为可能。
智能输入使我们忙碌的生活变得精彩和简单,也给某些特殊的人群带去福音。对于老年人而言,手写输入使得他们能够亲自体验信息技术的便利;而对于残疾人来说,语言和手写输入无疑便实现了其最大的价值。
IBM和汉王领跑
IBM在语音输入方面的霸主地位不容否认,IBM在语音识别领域的研究也已有20多年的历史,最近它又宣布将语音引擎放到Radhat的Linux中。在美国,IBM语音识别产品ViaVoice的销量达到百万套以上。IBM通过持续的研发在最近的两三年已经取得了突破性的进展,识别率接近95%。IBM希望将语音识别将从简单的听写,发展到更广的应用领域,人们将可以做到与计算机的真正对话。
与此同时,IBM也致力于将语音识别技术应用到PDA等移动设备之中。由于通过键盘鼠标输入不适用于移动计算环境,因而在移动计算领域,语音输入具有极大的发展潜力。但移动设备的资源通常比较有限,在这样有限的空间内要集成语音识别技术有相当大的难度,而这也是语音技术应用的最大空间。另外,语音识别技术自身还存在许多技术难题需要解决,比如对方言的适应性、容易受外界环境的干扰等。
而在中文手写输入领域称霸的则是一向不太爱抛头露面的汉王科技,这家脱钩于中国科学院自动化研究所国家文字识别中心的企业,凭借近20年的技术积累,在技术以及市场上都已遥遥领先于其他竞争对手。
早在1985年,现任汉王科技总裁刘迎建就研发成功了“联机手写汉字识别在线装置”,成为国内首创。刘迎建随后向国家“863”计划专家组提出的“样本收集-方法研究-系统实现”三级研究开发线路,在业界第一个把样本收集整理提到了重要地位,对促进我国手写汉字识别的研究起到了极其重要的作用。如今,汉王科技的手写识别系统已经发展到了第10版,其中的“行草王”及“大字符集”两大识别核心的突破,使得汉王手写识别产品不仅能识别一般的连笔字、繁体字、倒插笔顺字,还能完全识别手写行草体汉字,并且能识别国家GBK汉字标准字库中的所有27000个汉字,使手写输入真正达到了轻松自如的境地,同时也进一步确定了汉王在同业中的领先地位。
据悉,在目前的手写输入产品市场,汉王的市场占有率已经达到了75%。不管是商务通、联想、名人等知名品牌的掌上电脑,还是基于Palm OS或者基于Pocket PC的其他一些掌上电脑设备,目前使用的都是汉王公司的手写识别技术。联想、金长城、金恒生等国内许多知名品牌的电脑,以及大部分集成了手写输入功能的手机使用的也都是汉王的手写技术。正是因为在核心技术上的领先地位以及应用上的巨大成就,汉王手写识别技术还获得了2001年度的国家最高科技奖项--国家科技进步一等奖。
IBM已经将语音输入扩展到了Linux、手机操作系统上,而汉王也将手写输入扩展到了掌上电脑、电话机、手机上。2002年底,汉王科技进一步明确了“做核心、做应用、做扩散”的发展思路。
微软的努力
微软显然看到了智能识别技术这一发展趋势,而IBM和汉王显然不会放弃领先优势。习惯了领者风范的微软,绝对忍受不了与IBM和汉王各分一杯羹,可以预见,一场关于智能输入的争夺战即将拉开序幕。
由于自身缺乏核心技术的优势,因此在智能输入上微软还只能通过联盟的方式进行运作。早在1998年,微软的Windows CE中文版使用的就是汉王的手写技术,2001年6月,微软推出的Pocket PC中文版再一次使用了汉王的手写技术。前段时间,当大家都在批评Tablet PC的中文手写识别不尽人意时,业界又传出消息:微软正在就Tablet PC的手写输入问题与汉王进行合作。
作为软件行业的霸主微软显然明白核心技术的重要,但现在微软不得不面对在智能识别技术上受制于人的现状。为了改善这种情况,微软将一切希望寄托于1998年成立的微软亚洲研究院,其前身是微软中国研究院,是微软公司在海外开设的第二家基础科研机构,也是亚洲地区唯一的基础研究机构。
显然,微软对其亚洲研究院给予厚望。微软亚洲研究院的使命就是使未来的计算机能够看、听、学,能用自然语言与人类进行交流。目前在进行智能识别技术研发的有多通道用户界面组、语音技术组和自然语言组在各自领域进行探索。
微软当然会利用其在PC操作系统方面的优势,今后在微软的Windows和Office两大主力产品中都会加入对手写和语音输入的支持。微软曾经考虑过在Windows中加入对手写输入的支持,由于碍于和汉王的合作关系最终没有得逞,但是一旦微软启动这一计划,打击也将是毁灭性的,Netscape失败的例子已经证明了微软的威力。
微软野心勃勃,IBM希望缔造一个全方位的语音平台,汉王的目标是做中文非键盘输入的领导者,三者谁也不会示弱, IBM、微软、汉王之间这场关于语音输入和中文手写输入的斗争最后鹿死谁手尚难预料。
eNet硅谷动力(cio.enet.com.cn)