SequoiaDB巨杉数据库是一款支持SQL、高并发、实时性、分布式、可扩展、灵活存储的操作型NewSQL数据库(Operational NewSQL Database)。作为商业化的数据库产品,现已开源。SequoiaDB企业版还具有一系列企业级特性,帮助企业更好落地大数据。2018年,SequoiaDB巨杉数据库入选高德纳咨询公司数据库2017报告。
软件介绍
SequoiaDB使用分布式架构,下图提供了对SequoiaDB体系结构的一般概述。
在客户机端(或应用程序端),本地或/和远程应用程序都与SequoiaDB客户机库链接。协调节点不保存任何用户数据,仅作为请求分发节点将用户请求分发至相应的数据节点。
编目节点保存系统的元数据信息,协调节点通过与编目节点通讯从而了解数据在数据节点中的实际分布。数据节点保存用户的数据信息。一个或多个数据节点构成一个数据分片(Shard),不同的分片中保存的数据无重复。当存在多个数据节点时,节点间数据进行异步复制。分片中可以存在最多一个主节点与若干从节点。其中主节点可以进行读写操作,从节点进行只读操作。从节点离线不影响主节点的正常工作。主节点离线后会在从节点中自动选举出新的主节点处理写请求。节点恢复后,或新的节点加入分片后会进行自动同步,保障数据在同步完成时与主节点一致。
SequoiaDB支持基于网络容量的主动-主动数据中心,适用于同一城市中部署双数据中心,以及不同城市的数据中心间的灾难恢复需求。
发展沿革
2013年02月20日,SequoiaDBV1.0产品开发完成并发布,该版本采用全新分布式架构。
2013年04月06日,SequoiaDBV1.3发布,该版本完善了分布式特性,支持节点间数据复制、可配置的一致性级别与跨节点跨集合的事务功能,并可与Hadoop进行对接。
2013年10月23日,SequoiaDBV1.5发布,此版本包括了一些性能优化,功能增强以及bug修复。
2014年03月14日,SequoiaDBV1.6发布,此版本包括了新版图形化管理界面与一些功能性修复,且能够与Storm进行对接。
2014年07月04日,SequoiaDBV1.8发布,此版本包括了逻辑域的概念,与PostgreSQL对接并有大幅度性能提升,能够与Spark进行对接。
2014年11月,SequoiaDB V1.10发布,此版本增加了LOB大对象功能,自动化安装功能以及Python驱动等。
2014年12月19日,文档型NoSQL 数据库 SequoiaDB 宣布开源。
2015年3月发布 SequoiaDB V1.12 稳定版本。
2016年,发布SequoiaDB V2.0稳定版本。
2016年下半年,SequoiaDB V2.8.4稳定版推出。
2018年,SequoiaDB V3.0 正式发布,实现了MySQL协议级100%兼容,金融级分布式OLTP,全文检索等众多新特性。
2020年10月22日,SequoiaDB v5.0.1 GA 正式发布!增加三大“黑科技”: 跨引擎事务一致性,原生分布式金融级容灾,多云多平台支持。
2021年,巨杉数据库发布基于「湖仓一体」架构,针对不同的业务需求场景细分出全新的产品线。
获得荣誉
2021年2月,SequoiaDB入选2020年度中国信创TOP500。
2021年10月,入选2021信创产业独角兽100强榜单。
2022年,SequoiaDB入选“2021中国信创500强”。
2023年12月,SequoiaDB入选2023信创独角兽企业100强。
2024年12月,入选2024信创独角兽TOP100。
功能特色
SequoiaDB数据库,提供了基于PC服务器的大规模集群数据平台,为IT部门在提供稳定,可靠以及高效数据服务的同时,大大降低IT部门应用程序的开发,部署以及维护成本。
SequoiaDB数据库的主要特点:
通过非结构化存储与分布式处理,提供了近线性的水平扩张能力,让底层的存储不再成为瓶颈。
提供了完善的企业级功能,让用户轻松管理高并发性任务,以及海量数据分析。
增强的非关系型数据模型,帮助企业快速开发和部署应用程序,做到应用程序的随需应变。
提供了最终一致性与强一致性的双重机制,从根本上杜绝数据缺失。
提供了在线应用与大数据分析的后台数据库的结合,通过读写分离机制做到同系统中数据分析与在线业务互不干扰。
提供了精确到分区级别的高可用性,预防服务器,机房故障以及人为错误,让数据24x7永远在线。
SequoiaDB 3.0采用“存储-SQL”架构,其中SQL层和存储引擎层彼此独立,类似的架构也出现在许多新一代分布式数据库中,如AWS的Aurora。此外,SequoiaDB提供完整的ACID支持和跨节点/集群的事务,确保了数据的原子性、一致性、隔离性和持久性。
SequoiaDB为所有受欢迎的编程语言提供了原生驱动程序,为营造自然的集成开发环境而提供了框架。支持的驱动程序包括C、C++、Java、.NET、PHP、Python等。
SequoiaDB命令行是一个交互式的ECMAScript执行环境,几乎所有SequoiaDB支持的命令都通过命令行执行。
SequoiaDB提供了与PostgreSQL关系型数据库连接的外部表驱动,使用户可以通过标准SQL访问SequoiaDB。
SequoiaDB支持很多类型的查询。包括了键值对查询、范围查询和聚合框架查询。此外,SequoiaDB还配备了查询优化器,自动优化查询。
SequoiaDB包括文档中任何字段多种类型的索引,包括唯一索引、复合索引以数组索引。
SequoiaDB同时支持关系(结构化)、对象数据(非结构化)和JSON(半结构化)数据模型,为企业内异构数据整合提供了一种标准的方式。SequoiaDB具有与Spark集成的Spark连接器,可以作为Spark的数据源,并支持Spark SQL,实现HTAP能力。
SequoiaDB巨杉数据库与Hadoop/Spark均有深度集成,可以作为分析架构的底层存储使用,保证了系统既可以进行实时查询、又可以通过读写分离机制,实现数据的离线分析。
参考资料
2020年度中国信创TOP500.硅谷动力.2025-02-09
2021信创产业独角兽100强.百家号.2025-02-12
SequoiaDB分布式数据库2022.3月刊.巨杉数据库.2025-02-07
2023信创独角兽企业TOP100.硅谷动力.2024-12-30
2024信创独角兽TOP100.德本咨询.2025-02-11