Q:有人说,大数据如同很多的建筑材料,如果没有很好的创意,是造不出好房子的。从这个角度而言,应该用怎样的思想来指导大数据的应用?
A:如何使用大数据,取决于你的目标,也就是你想用数据做什么。目标会引导你如何收集和筛选数据,如何对数据进行整合与关联,所以最重要是要有想法,有idea,这也是客户行为分析软件发展的一个趋势。
什么才是适合非电商领域的客户行为分析方法?经过这几年的探索,大家基本上达成了一个共识:就是各个行业的商业模式不同、运营模式不同、发展阶段不同,选用的方法也不同。真正的解决方案就是行业自己的一个客户群方案以及相应的客户群分析软件。要根据目标,基于主题,决定如何运用大数据。
从主题上看,有的是以服务为主,比如电信运营商的呼叫中心;有的是以营销为主,比如零售业。他们的目标不同,也就决定了他们使用大数据的方法不同,特别是对用户属性的定义上,这也就回到客户分析软件要解决的第二个问题——定义客户属性。
在这一点上,远传技术进行了深入的研究,从用户的年龄、性别、学历等多个维度定义客户属性,并主张进行跨渠道客户行为分析。以电信运营商和银行为例,他们都有很多服务渠道,包括手机、PC、互联网、电话等,目前这些渠道大都是各自运营,不能统一分析数据。如果把渠道构建成一个全景客户视图,进行跨渠道客户行为分析,对企业将大有裨益。
跨渠道的客户行为分析,会给客户打上精准标签,比如这个客户是新业务型,那个客户是积分偏好型,这样会给营销带来非常好的效果。另瓦还有一个交互轨迹,比如iPhone5出来了,有一个人到网上营业厅看了两次的介绍,这是潜在客户,如果主动拜访他,销售成功率将大大提升。
除了有明确的目标和想法之外,还需要有一个周密的计划,规划数据源的获取,数据分析方法和工具等,所以大数据分析应该是目标导向的。
Q:大数据类型繁多,价值密度相对较低。如何利用算法等具体工具进行“提纯”?
A: “提纯”数据的前提是采集数据,以网站为例,现在最常用的两种技术分别是页面标签技术和服务器日志文件技术。页面标签技术是一种从访客浏览器端收集数据的技术,通过放置在网站中每个页面的javascript代码进行收集。日志文件技术独立于浏览器,是一种基于服务器端的数据收集技术,采集所有发送到服务器的请求,包括页面、图像等。其他的技术包括从路由器上收集数据,或通过插件采集。目前为止应用最为广泛的是页面标签技术。
为了能够应对超大数据量,以及高性能、高可用、易扩展的要求,一些新兴的技术如Nosql、Hadoop等在大数据时代将会得到广泛的应用。
Q:请问您如何看待大数据的未来?
A:在未来,大数据将会得到越来越多的应用,并不断对当前的商业模式、技术创新产生颠覆式的影响。但人在数据分析和应用过程中仍然占据着重要的地位,大数据分析的结果只能为我们的决策提供帮助。我想大数据分析会有一个美好的明天。
关于葛培明
葛培明,同济大学博士后,现任杭州远传通信技术有限公司上海研发中心总监。在大型决策支持系统研发、计算智能、数据分析与挖掘等领域有多年的研究开发经验。曾先后在柯达全球研发中心、微软等企业从事研究开发与管理工作。加入远传技术后主持客户行为分析系统的研究与开发工作,该系统在业内获得多大奖,已经得到广泛应用。