- DINFO-OEC是非结构化大数据分析挖掘平台
- 由业务建模技术和分析挖掘技术组成
- 能处理任何来源的非结构化信息和半结构化信息
- 将繁杂无序的非结构化信息,通过创建的业务模型规则,进行分析,得出有序的结构化数据
……
新一代信息技术与经济社会各领域的深度融合,引发了数据量的爆发式增长,使得数据资源成为国家重要的战略资源和核心创新要素。据统计,全球所掌握的数据,每两年就会翻倍。到2020年,全球的数据量将达到40ZB,其中我国所掌握的数据将占20%。大数据的广泛深入应用,使人类社会逐渐走向数据经济时代。
早在2015年,国务院发布了《促进大数据发展行动纲要》,以加快政府数据开放共享,推动资源整合,提升治理能力;推动产业创新发展,培育新兴业态,助力经济转型;强化安全保障,提高管理水平,促进健康发展为主要任务。神州泰岳积极响应《行动纲要》,在人工智能与大数据业务上飞速发展,深入钻研,推出了业界首款面向业务建模的DINFO-OEC非结构化大数据分析挖掘平台。

本篇我们将为大家分享DINFO-OEC非结构化大数据分析挖掘平台的主要功能特点概要,后面几期文章我们会围绕这些主要功能点详细展开。
DINFO-OEC的价值
大数据中80%都是非结构化大数据,非结构化大数据因其中的业务对象、对象之间的关系等都蕴含在文本内容中,而文本内容来源繁多、表达方式灵活多样、存在着大量的歧义性,因此无法使用传统的BI工具等进行分析,无法直接服务于业务,实现业务价值。因此非结构化大数据是大数据处理的难点和热点。
DINFO-OEC是非结构化大数据分析挖掘平台,由业务建模技术和分析挖掘技术组成,能处理任何来源的非结构化信息和半结构化信息。将繁杂无序的非结构化信息,通过创建的业务模型规则,进行分析,得出有序的结构化数据。适用范围广,可以适用于信用卡投诉领域、电商评价领域、企业关联关系挖掘领域等。能够根据不同场景、领域对复杂需求进行定制。
DINFO-OEC主要功能点介绍
一、应用接口:应用接口定义后,能够通过接口逻辑中的算法组件链接进行相应的语义分析。主要由接口定义、接口逻辑、接口发布组成。
- 接口定义:包含接口的创建、修改、删除。
- 接口逻辑:包含接口算法组件的链接,组件属性的设置。
- 接口发布:包含接口列表、删除已创建的接口、将接口导成模板等功能。

图:接口定义


图:接口逻辑


图:接口发布
二、应用建模:根据业务需求进行模型创建,通过创建的业务模型,对非结构化数据进行分析挖掘。主要由模型规划、模型建设、模型发布组成。
- 模型规划:对模型进行创建。
- 模型建设:包含本体建设、要素建设、概念建设、资源分配、模型调试。
- 模型发布:包含模型列表、搜索模型、发布模型、删除已创建的模型、将模型导成schema等功能。

图:模型规划


图:模型建设


图:模型发布
三、应用任务:在应用任务中,设计好接口的分析规则、统计规则后,能够根据指定的规则分析数据源中的数据。
主要包含:任务添加、任务编辑、任务删除、任务运行、任务中断、任务启动、任务终止、日志查看、条度设置、结果查看、结果导出、导出查询、任务详情查看等。

图:应用任务
四、应用模板:在应用开发中,可以将已发布的接口导成应用模板,导出成功后即可在应用模板查看。应用模板主要是对模板资源的展示,支持详细信息查看,如模板中的接口列表、模板中的接口信息等。

图:应用模板列表


图:模板信息
五、模型schema:在应用建模中,可以将已发布的模型导出成模型schema,对模型的资源进行积累。模型schema主要是对模型资源的展示、和资源详情查看,如模型的本体树结构、要素树结构、概念树结构等。

图:模型schema列表


图:模型详情
六、语言资源:对语言资源的统计。包含概念资源、通用资源、领域资源、用户资源的占比详情和建设详情。

图:语言资源
纵观全文,我们基本可以了解到DINFO-OEC不仅能提供强大的非结构化大数据分析挖掘能力,同时平台面向业务的建模也极大提高了业务人员的工作效率——业务人员只需要重点关注业务场景逻辑梳理及其表述,不需要关注技术实现细节,极大地缩短应用场景创新周期。DINFO-OEC的出现,推动了行业在中文文本领域处理技术向前迈出了一大步,也促使企业在开发应用时专注于业务的大数据创新,而不局限于语义技术和文本技术的研究方面。