近年来,大数据行业的科技新贵备受资本市场的热捧。2020年9月,云数据仓库平台Snowflake在美国纽交所挂牌上市,首日涨幅即超110%,市值破800亿美元。

在国内,星环信息科技(上海)股份有限公司(以下简称“星环科技”)将于2022年9月30日启动新股申购。一旦在科创板上市,有望成为国产大数据基础软件第一股。

招股书显示,星环科技计划募资19.6亿元。其中,8.98亿元用于大数据与云基础平台建设项目,7.09亿元用于分布式关系型数据库建设项目,3.53亿元用于数据开发与智能分析工具软件研发项目。

随着国家政策扶持力度的不断增强,大数据已经成为了重要的生产要素,大数据产业作为战略性的新兴产业,成为加快数字经济快速发展的重要引擎。而星环科技为政企数字化转型提供关键的数据基础软件,有望在数字化转型的浪潮以及政策推动下受益。

大数据基础软件,乘上政策“风口”

2021年11月30日,工业和信息化部发布《“十四五”大数据产业发展规划》,要求到2025年我国大数据产业测算规模突破3万亿元,年均复合增长率保持25%左右,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。在加强资金支持方面,鼓励政府产业基金、创业投资及社会资本,按照市场化原则加大对大数据企业的投资;支持符合条件的大数据企业上市融资。

同一天,工信部还发布了《“十四五”软件和信息技术服务业发展规划》,提出聚力攻坚基础软件,推动操作系统与数据库、中间件、办公套件、安全软件及各类应用的集成、适配、优化,加速分布式数据库、混合事务分析处理数据库、共享内存数据库集群等产品研发和应用推广。

当前,国内数据管理软件仍被甲骨文、IBM和微软为代表的国外关系型数据库厂商主导,国产软件产品渗透率呈逐渐上升趋势。中国信息通信研究院院长余晓晖曾指出,未来几年,大数据技术创新不仅在前沿技术发展的层面,全产业链创新能力和自主可控水平也将进一步加强,基础软硬件底层支撑能力不断提升,大数据与前沿领域技术融合创新进一步深入。”

随着国家政策的大力支持,以及国内客户越来越重视数据与信息安全,国产大数据基础软件有望迎来发展的“风口”。而星环科技所处的大数据行业作为政企数字化转型的关键基础软件,有望在数字化转型的浪潮以及相关政策推动下受益。

坚持自主可控,自研代码率超过70%

招股书显示,星环科技是一家企业级大数据基础软件开发商,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件及服务,已形成大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵。目前已累计有超过1000家终端用户,分布在金融、能源、交通、政府、教育、医疗等20多个行业。

2019年-2021年公司营业收入分别达到 1.74亿元、2.60亿元、3.31亿元,三年复合增长率为37.80%,呈逐年上升趋势。2022 年 1-9 月仍保持增长,预计营收为 1.60亿元至 1.93亿元,较上年同期增长 17.86%至 41.76%。

迄今,星环科技已为金融、能源、制造、交通等行业多个客户实现了数据分析场景中部分关键信息系统的国产化,涉及传统关系型数据库Oracle、IBM DB2、Teradata,以及搜索引擎Elastic Search、大数据平台Cloudera Data Platform、数据统计分析软件SAS等多家国外主流厂商产品。

相比国内供应商大多采用国外开源大数据软件或者商业大数据平台,星环科技则坚持核心技术的自主研发,成立九年来,自主可控的基础软件产品比例逐年提高。

根据工信部电子第五研究所代码扫描测试报告,星环科技大数据平台TDH 的1200万行代码里自研代码率超过70%,ArgoDB代码自主率(行数)分别超过90%。

2020年,星环科技牵头承担了包括工信部《2020年新兴平台软件项目-大数据平台软件》、上海市《全栈型云平台产品研发及生态建设》等重大科研项目。截至2022年6月,公司已获授权境内专利77项(其中发明专利74项)及境外专利8项,已取得软件著作权328项。

多项技术超前布局 领先业内2-3年

早在2016年,星环科技就被Gartner列入数据仓库及数据管理分析魔力象限,是其发布该魔力象限以来首个进入该魔力象限的中国公司。在IDC 《Market Scape:中国大数据管理平台厂商评估,2020》中,星环科技位列中国大数据管理平台市场的领导者。

从产品发展历程来看,星环科技在分布式技术、数据库技术、多模型数据的统一处理技术、基于容器的数据云技术等方面都实现了超前布局,领先业内2-3年。

在分布式技术方面,星环科技的大数据基础平台TDH是全球首个通过TPC-DS基准测试并经官方审计的产品,打破了该领域十二年来没有公司通过该项测试的局面。

公开信息显示,星环科技的产品从2015 年开始支持分布式事务技术,提供了强一致性(Strong Consistency)和完整性的保障,打破了当时业界普遍认为大规模分布式系统只能实现最终一致性(Eventual Consistency)的认知,该技术较业界同行领先3年,扩大了大数据技术在关键核心系统中的应用范围。有了强一致性保障,开发者能够更加方便地开发大数据应用系统,该技术已经在国内金融、能源等行业大规模落地。

在多模型融合技术方面,TDH的大数据技术架构实现了统一的SQL引擎,统一的分布式计算引擎和统一的分布式数据管理系统和统一的资源管理系统,以及多种异构的数据模型,使得用户可以通过统一入口对关系型、文本、图数据等数据模型进行操作。在大数据技术领域,星环科技率先具备了业内领先的覆盖多模型的数据能力。

Gartner 2022年6月发布的《中国数据库管理系统供应商识别指南》中,星环科技成为覆盖7个或以上品类的四家厂商之一和Gartner认可四家多模厂商之一。

数字经济大数据概念股(大数据产业站上万亿风口)(1)

在云原生技术方面,星环科技在2017年6月发布基于容器云的资源管理技术,将大数据技术与容器云技术有效结合。而国际知名大数据厂商Cloudera和Red Hat直到2020年才达成合作,把Cloudera的相关产品以外部OpenShift作为容器云解决方案。

此外,星环科技早在2018年推出基于容器云技术的数据云平台TDC,而国外云数据平台Snowflake在2020年才开始大力推广“数据云”技术架构。

结语

随着数据量指数级增加,传统的集中式架构软件已难以应对数据存储处理的工作量与复杂度,分布式架构正逐渐成为主流。这也是国产大数据软件的机遇所在。

作为国内为数不多的专注于大数据基础软件平台的供应商,星环科技已成了从底层的关系型数据库、大数据平台到中层的图数据库,再到上层知识图谱应用的全栈产品。凭借对自主研发的高度重视,在分布式技术上的业务壁垒上具备相当的竞争力。

根据招股书,星环科技2019年至2021年研发投入占营收比均超过40%,而此次募集资金的用途也将用于大数据与云基础平台、分布式关系型数据库等项目的建设。

随着数字经济时代的到来,数字化转型需求大量释放,大数据软件产业迎来新的发展期。待上市后,星环科技的未来前景无疑令人期待。

,