图数据库:释放互联数据的力量
【新品产上线啦】51CTO播客,随时随地,碎片化学习
【51CTO.com原创稿件】从Hadoop生态圈崛起开始,大数据已经热了十多年,大数据的存储、分析、处理等技术都已经比较成熟。发掘大数据之间的关联,以及关联后隐藏的商业价值,是大数据的真正意义所在,也是技术上的一大难点。 数据库做为组织、存储和管理数据的仓库,是大数据的基础和关键一环。数据库咨询公司 DB Engines 调研结果显⽰,图数据库正成为所有数据库管理系统中增长最快的⼀类。 图数据库更注重关系 图数据库,对于很多人来说还比较陌生。其实,图数据库是用图来存储数据,是最接近高性能的一种用于存储数据的数据结构方式之一。构成一张图的基本元素是节点(点)和关系(边)。节点和关系都可以设置自己的属性。节点经常被用于表示一些实体,但依赖关系也一样可以表示实体。节点之间的关系是图数据库很重要的一部分。通过关系可以找到很多关联的数据,比如节点集合、关系集合以及他们的属性集合。 举个例子,对于社会网络中人与人之间的关系来说,用关系型数据库存储这种数据的效果并不好,其查询复杂、缓慢、超出预期,而图数据库的独特设计恰恰弥补了这个缺陷。关系是图数据库特有的组成部分,相对于关系数据库中的各种关联表,图数据库可以通过关系包含属性这一功能来提供更为丰富的关系展现方式。
原生、分布式、并行图数据库 原生,意味着不基于一个关系型数据库的表来存图,也不基于一些Key-Value系统,不把数据打乱存在别的存储系统里。TigerGraph围绕图做了存储、计算引擎、查询语言、可视化工具,所有这些都只是围绕图,而不基于关系型数据库,也不基于文档数据库。 说到并行,并不仅仅是多机分布式。其核心在于,图中的一个节点、一个边都存在属性,都是并行的存储单元。但并行最重要的核心是计算,多核、多CPU、多线程,是并行最核心的要素。 TigerGraph 进入中国市场不久,已经收获了金融、银行、电力等行业的大客户,这得益于TigerGraph强大的技术优势。 首先,在实时计算技术方面,一般的查询涉及到几千万到上亿个节点和边关联,点是实体,边是关系,TigerGraph的实时计算可以每秒每机遍历数亿个顶点/边,步数可达三步或更多,比传统⽅法快多个数量级。 第二,支持数据库的增、删、改、查,是业界正式商用的数据库。每台机器每⼩时可加载 100 到 200 GB 数据的能⼒,不再需要批量加载。 第三是超大规模,在只有20台商⽤计算机的集群上,能够将20亿以上的每日事件实时流式传输到具有超过1000亿个顶点和超过6000亿个边的⼤数据图谱。TigerGraph图数据库已经成功地在世界上多个行业第一的公司生产线上运行了多年。 此外,TigerGraph的产品化程度很高,用户只需在TigerGraph网站上下载软件、技术文档,就可以自己去做图模型、数据录入、二次开发等,不需要TigerGraph的人员指导。 组建本地团队:推动市场、推动生态 目前,TigerGraph在中国组建了团队,据TigerGraph中国区总经理乌明捷介绍,中国团队的工作主要有以下三个方面: 1、提高大众对图的接受度和了解度。最初,TigerGraph认为金融行业会是使用图数据库最多的行业,但是经过一年的市场推广发现客户其实来自各个行业。比如物流调度IoT,需要用图来解决路径规划的问题。中国的大数据市场比较活跃,企业也愿意尝试新技术,所以TigerGraph希望推动这个市场。 2、推动合伙伙伴生态的建设。TigerGraph不卖数据,不做具体的应用,对合作伙伴持有开放的态度,中国团队的组建将有利于推动整个生态的发展。 3、快速响应客户需求。当中国客户有需求的时候,通过目前在国内的技术和咨询团队,可以进行快速响应。 从客户的痛点入手 当今,很多企业往往使用若干个不同的数据库,来解决不同部门的问题。TigerGraph进入客户是一个顺势而为的过程,先解决别的数据库工具不能解决的问题,和其他关系型数据库结合在一起,构成一个成熟的、有效的分析环境。 TigerGraph凭借强大的图数据库,为企业提供实时分析应用程序,在反欺诈和反洗钱、消费者智能、智能供应链、智能电网等应用中都有着出色的表现。 【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】 【责任编辑:赵立京 TEL:(010)68476606】点赞 0 (编辑:湘西站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |