产品展示

联系我们

Trinity BDM


TrinityBDM 支持 Hadoop MapReduce/HDFS/Hbase 平台,提供丰富的非结构化数据处理能力,包括文档、网页、博客、论坛、社群网站与No-SQL数据库等。


降低技术门槛,助企业快速导入大数据分析应用

以简易 GUI 操作,大幅降低技术复杂性,企业可以较低成本来快速导入Big Data,不再耗时于评估与学习。

●复杂的 MapReduce 发布程序经由简化的MapReduce 程式界面来控管;

●经由 Cascading Plug-in,只需拖拉式设定Cascading 元件即可完成数据处理;

●经由 Mahout Plug-in,只需简单的设定即可呼叫 Mahout 完成数据分析;

●整合 Hive与 Pig 语言,让用户轻松编写程序,以进行复杂的数据分析。


快速桥接大数据分析与企业既有BI系统

此外,可选购UDM (Unstructured Data Management) Plug-in,以对诸如文档、网页、博客、论坛、社群网站与No-SQL数据库等非结构化数据源抽取文字信息,并进行基本的文本处理。


快速桥接大数据分析与企业既有BI系统

BI 产业的应用技术如 OLAP、Mining 等早已成熟,企业也许已经建立 BI 系统,目前的困难是难以处理Big Data。TrinityBDM 可将非结构化数据筛选出,作为 BI 底层之新资料源;再与既有的关系型数据一并汇整入企业数据仓储中,后面即可套用业界成熟的数据分析方案。

Trinity UDM

Big Data繁复多样的数据,包括MS office/Open office/PDF/RTF/Epub等各式档案、HTML/RSS等各种网页与Facebook/twitter等社群内容、以至于各种NoSQL与搜索引擎数据库等等,对一般企业形成了技术障碍与负担。相对于已熟悉的结构化数据处理工具,企业IT亟需导入一套有效处理非结构化数据的工具,以导入Big Data分析。


TrinityUDM非结构化数据管理系统是一套建立在作业调度管理 (TrinityJCS) 之上、整合结构化数据 (TrinityETL) 与非结构化数据处理功能的数据整合软件:

●内建非结构化数据分析引擎及存取/转换/处理组件,作为Big Data分析的基础;

●提供文本数据挖掘功能,可作Big Data分析,或供转换为结构化数据,与既有数据储 存及分析工具整合。

如下图。


多样化数据读取与网络爬文


TrinityUDM提供各式档案(MS office/Open office/PDF/RTF/Epub等)读取、主流NoSQL(MongoDB/OrientDB/Cassandra)与搜索引擎(Solr/ElasticSearch)数据库读取、以及网络爬文(HTML/RSS等各种网页与Facebook/twitter等社群)功能。


丰富的文本分析处理


非结构化数据中较难处理者为文本数据,针对所读取的文本内容,TrinityUDM提供语系识别、文件断句切词、文件相似性判断、文件分类、文件分群、文件样式匹配、文件摘要、文件主题及趋势等分析处理功能。文件断句切词功能可将文本内容抽取,转换为结构化数据。


供应Big Data与传统BI分析应用

TrinityUDM支持数据写入NoSQL(MongoDB/OrientDB/Cassandra)、搜索引擎(Solr/ElasticSearch)数据库与ODBC,前者可介接Big Data分析、后者则供介接传统BI系统。