近期,Gartner、CB Insights两家机构接连发布了图数据库相关报告,让火热的图数据库市场更加引人关注。

Gartner 发布的《图数据库管理系统市场指南》对全球图数据库产品进行全方位评估,评选出32款代表产品,其中有不少中国图数据库产品,来自于图数据库创业公司,云厂商,也包括即将登陆科创板的星环科技。能够获得世界权威机构的认可,可见在图数据库这个方兴未艾的细分赛道,中国图数据库产品并没有输在起跑线上,有能力也有机会大放异彩。

星环科技战略全面升级(星环科技覆盖十条数据库赛道如何做到以一当十)(1)

细分赛道,中国数据库产业的新机遇

千禧年后,随着互联网的发展,海量数据爆发,企业业务越来越复杂多元化,文本、文档、图片、视频等半结构化、非结构化数据不断增长,传统的关系型数据库面临这些日益复杂的数据处理需求产生了瓶颈,催生出时序数据库、图数据库、文档数据库等NoSQL数据库发展,并随着移动互联网、物联网、AI等新技术的涌现,近年来各细分领域的需求更为迫切。

如图数据库以图论为理论基础,使用图模型,将关联数据的实体作为顶点(vertex)存储,关系作为边(edge)存储,解决了数据复杂关联带来的严重随机访问问题,拥有比关系型数据库快得多的复杂关联数据查询性能。比如到了6-10度关联查询,关系型数据库已经无法支持,但图数据库能够高效支持。

所以在金融反欺诈、反洗钱场景等数据量大、关系复杂,且需要深度查询的场景,图数据库会更有优势,现实中也已经有很多落地实践。Gartner《图数据库管理系统市场指南》指出,“大型传统数据库公司和平台供应商以及初创公司都瞄准了这个机会,因为市场对图数据库管理系统领域的兴趣和势头正在明显扩大。所有垂直行业的数据和分析领导者都在推动图技术在更多场景的应用,例如提供推荐引擎、客户360、欺诈检测等服务。”

正如前文所述,在图数据库这个领域中国图数据库产品并没有输在起跑线上,有能力也有机会大放异彩。中国厂商也在加码布局。实际上不只是图数据库,在时序数据库、文档数据库等细分赛道,也涌现出不少中国数据库产品。

“在新的细分数据库赛道,我国的数据场景丰富,数据库产品起步早,应用广,具备国际领先性。我国数据库产业应当通过在时序数据库、图数据库、文档数据库等品类上面,投入一些大量的力量和引导,形成一些差异化竞争,创新引领产业格局。”中国赛宝实验室李冬(博士)在日前某会议上指出,中国数据库产业在图数据库等细分赛道拥有巨大机遇。

中国数据库市场参与者既有单个细分领域的创业厂商,深耕一处,力出一孔,积累优势,也有云大厂,有相对完善的数据库产品栈,此外还有比较特别的星环科技,外部普遍将其定位为一家大数据公司,但其却拥有着非常全面的数据库产品。

以一当十,覆盖十条数据库赛道

有媒体将即将上市的星环科技定义为“国产大数据基础软件第一股”,根据官方介绍,星环科技是一家企业级大数据基础软件开发商,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件及服务。

该公司的数据库产品几乎囊括数据库领域的全部类别,关系型数据库有ArgoDB、KunDB,图数据库StellarDB,搜索引擎Transwarp Scope,文档数据库DocStore,时序数据库Timelyre,时空数据库Spacture,宽表数据库Hyperbase,键值数据库KeyByte等,覆盖了十条数据库赛道。

实际上这十个赛道国外都有独角兽甚至巨头,如图数据库领域Neo4j获得F轮融资后估值达20亿美元,搜索引擎Elsasticsearch在2018上市,当时市值50亿美元,文档数据库MongoDB目前市值超过100多亿美元,Snowflake市值528.35亿美元……

星环科技是如何能够覆盖如此全面的数据库赛道并取得优异成就的?在与星环科技相关专家交流中,发现了其中的秘诀。

持续创新,引领技术发展

星环科技始终坚持“自主研发、领先一代”的技术发展策略,经过多年的自主研发,重构了大数据与分布式数据库软件栈,在分布式技术、SQL 编译技术、数据库技术、多模型数据的统一处理技术以及基于容器的数据云技术等方面具有技术领先性。这些先进技术为后续一系列数据库产品的诞生和发展打下了坚实的基础。

从公开渠道可知,多模型一直以来是星环科技的主打特色。顶级SCI期刊ACM COMPUTING SURVEY上发表的《《Multi-model Databases: A New Journey to Handle the Variety of Data》对多模数据库现状和发展进行了详细阐述,对市场面主流数据库的多模型能力进行了评估,将多模型能力实现路径分为四种。

星环科技战略全面升级(星环科技覆盖十条数据库赛道如何做到以一当十)(2)

以 Couchbase 和 MarkLogic 为代表的第三种多模型架构是当时业内比较主流的路径,其在多种独立数据库之上提供统一的用户界面,对底层多个数据库进行转发。但是没有解决底层多个数据库的运维和数据管理问题,存在架构复杂度高,开发和运维成本高,数据处理效率低等问题。

星环科技早在2017年提出了多模型数据统一处理理念,并在2020年5月实现多模型数据的统一处理技术,支持同一平台处理多种不同的数据模型,大大降低架构复杂度和开发运维成本,提高数据处理效率。在统一融合的数据平台架构基础上,通过9款存储引擎支持关系型数据存储、对象存储、文档存储、宽表存储、事件存储、时序数据存储、键值存储、图存储、地理空间存储、搜索引擎等10种数据模型,相比业界同行的多模能力,支持的数据模型数量更多。

多模型统一架构意义在于通过把多种数据模型的接口层、计算引擎层和分布式存储管理统统抽象了出来,形成统一的接口,统一的计算引擎,统一的数据管理,统一的资源管理,通过不同的存储引擎来支持不同的数据模型,这样有效的避免重复造轮子,大大缩短了研发周期。而统一的数据管理系统,实现了统一的数据分片、复制、存取和事务管理,使得公司能够更快捷地开发不同模型的存储引擎,具备较好的模型扩展性。

对于企业客户而言,基于此多模型统一架构,可以根据业务需要,灵活增减需要支持的数据模型,比如,企业有图数据处理需求,可以直接使用StellarDB,如果企业还需要处理文档数据,无需再另起炉灶,引入一个单独文档数据库,只需要在原先架构基础上新增文档存储引擎即可,无需改造,快速落地。同时不同的存储引擎之间能够灵活组合成不同的解决方案,轻松实现跨模型联合分析,挖掘更多的业务价值。

业内认可,发展势头强劲

在客户和第三方权威机构方面,星环获得了很好的认可。据悉,2016年,星环科技被Gartner选入数据仓库及数据管理分析魔力象限,是其发布该魔力象限以来首个进入该魔力象限的中国厂商;2018年成为全球首个通过TPC-DS基准测试及官方审计的厂商;2020年,成为IDC中国大数据管理平台市场的领导者;今年,包括StellarD、KunDB在内的7款产品或子产品入选Gartner《中国数据库管理系统供应商甄选》;2021/2022连续两年被Gartner《中国ICT技术成熟度曲线报告》列为增强数据分析技术推荐供应商、数据中台推荐供应商……

客户方面,根据其招股说明书,截至 2021 年 6 月末,星环科技已累计有超过 1000 家终端用户,分布在金融、政府、能源、交通、制造等众多国民经济支柱领域,具备广泛的客户基础。

星环科技自成立以来,成为大数据基础软件提供商,自主研发的产品能够满足国产化自主可控需求。根据工信部电子第五研究所代码扫描测试报告,星环科技大数据平台TDH 的1200万行代码里自研代码率超过70%,ArgoDB代码自主率(行数)分别超过90%。并且完成了与主流信创生态厂商的适配互认,在金融、政府等十多个行业应用落地。这一点在目前国产化大趋势下,或会给星环科技带来了新的发展机遇。

据安信证券对数据库国产化市场进行测算,国内数据库市场规模约为300-400亿元/年,国产化数据库替换市场总体规模约为3000亿元。在百花齐放的中国数据库市场,大的机遇也将伴随着更为激烈的角逐,期待星环科技上市后有更好的表现。

,