E企研究院 · 2023年06月26日 · 山西

从内核和架构 看openGauss的“创新进击”

629.png
作为基础软件之一,国产的数据库一直是信息产业相对薄弱的环节。

但随着数字化的发展进入快车道,国内数据库生态迎来蓬勃发展,并不断涌现出极具创新力的产品,推动了数据库应用的遍地开花。其中,openGauss就是佼佼者。

在近日举办的openGauss Developer Day 2023大会上,openGauss开源数据库首席架构师、社区技术委员会委员黄凯耀,为大家分享了openGauss最新发布的5.0版本的多项架构创新,并对其新特性进行深度解读。会后,我们也有幸采访到黄凯耀先生,和他更加深入地聊了聊openGauss以及他对国产数据库领域的一些看法和见解。

双引擎驱动的openGauss 5.0 强在哪?

回顾过去,数据库技术迭代的背后是数据模型的变迁、分析型需求的兴起、分布式架构的演化以及开源模式的流行。我们今天能看到,数据库从最开始的层次/网状数据库,到集中式架构的、主要面向OLTP需求的关系型数据库;再到独立出MPP架构的OLAP数据仓库;然后到更适合非结构化的、海量数据的、分布式架的NoSQL数据库和大数据处理框架;再到同时结合了SQL和NoSQL的优势的NewSQL等。面向未来,随着云计算、5G、物联网等新技术逐步成熟,黄凯耀认为,多模多态、算力融合、智慧运维将成为未来数据库面临的全新挑战。

据黄凯耀介绍,为了应对这些挑战,openGauss 5.0进行了重大升级,通过内核和架构的双引擎的创新,实现数据库技术的突破。

首先,在内核创新方面,最新发布的openGauss 5.0版本与之前的版本功能特性保持兼容,除了全链路的性能的优化,还在高智能、高安全等进行了技术创新,为用户带来更好的价值:

● 在高性能方面,openGauss 5.0进行了全链路的性能优化,包括底层算子、并行、并发,一直到整个池化层,充分调动资源,充分利用资源,让性能达到最优。优化后,多个指标提升30%~40%。另一方面,openGauss 5.0做了全局共享,极大地提升了并发量,让系统又快又稳的运行。

● 在高可用方面,openGauss 5.0今年带来了两个重要的架构突破:通过共享存储,存储副本可以降低到原来的1/3,大幅提升存储空间利用率;通过共享内存,提升读取性能,做到零延迟的读。除此之外,此版本还带了了闪回的功能,让数据可以回滚到之前的时刻,保护数据的安全。

● 在高智能方面,通过DBMind 自治平台实现数据库管理,实现第三代智能优化器 ABO升级,解决传统CBO/RBO在基数估算以及计划选择方面的痛点难题,使复杂查询计划更优,性能提升30%以上。

● 在高安全方面,利用基于注意力机制的异常行为检测技术,精准捕捉攻击行为;利用基于标签的访问控制,保证机密数据管控安全,提升防护等级。

其次,在架构创新方面。openGauss 5.0坚持以用户场景驱动,持续创新架构,围绕多模多态、智能运维等用户需求和痛点,推出了DataPod + DataKit组合,打造全新的数据底座。

首先DataPod可以分为计算池化、内存池化、存储池化三层,通过软硬协同,全栈优化,最终实现全栈可观测、可跟踪、开箱性能即最佳的资源池化架构。在计算池化方面,DataPod可以进行多样化算力的优化,包括传统的X86、鲲鹏等算力,使用最合适的数据库引擎去满足不同应用的数据处理诉求;在存储池化方面,不仅支持多种存储,实现NDP算子卸载,还可以支持DPU硬件加速,支持NoF新型存储访问协议;在内存池化方面,实现计算节点间内存互联,支持RDMA高速访问,打造了一个透明的跨节点内存池。

DataKit的定位为openGauss的数据全生命周期管理平台,它以插件化架构为主体,定义插件间的标准化交互接口,通过社区协同开发,覆盖部署、开发、运维等6大场景。

值得注意的是,DataKit也是一个工具开发平台,还支持用户根据插件接口和规范实现自己的特有功能。功能插件支持动态加载到DataKit上运行,也支持从DataKit上动态卸载。插件支持调用平台和其他插件的开放接口获取相应数据和功能,以实现快速构建特色功能。

“未来,openGauss希望通过内核和架构的双引擎驱动,实现数据库技术突破,为大家带去一个更简单、更优雅、更开放、更智能的数据库的使用体验。”黄凯耀如是说。

openGauss开源三年来,如期兑现四个LTS版本

自2020年6月30日开源以来,openGauss数据库吸引了众多内核开发者的关注。如今已经开源了将近三年的时间,openGauss一直思考如何去构筑更好的国产数据库,如何在内核的架构和基础创新上面引领行业的发展。

在2020年发布的第一个openGauss基础版本中,就格外重视两大关键特性:一是高性能,在两路鲲鹏下TPCC Benchmark达成性能150万tpmc;另一个是高可用性,支持主备同步,备机并行恢复,10秒内即可升主提供服务。

在2021年发布的第二个版本中,openGauss在保持原有特性情况下新增了众多特性,特别是在高性能、高安全和智能化的打造上有了更大的突破,并提出了“四高”的内核,引领了数据库行业的发展。

到了2022年,openGauss 3.0针对应用场景进行重大升级,发布四项新的能力:包括面向边缘场景的轻量化版本;完备的集群管理组件;支持 MySQL 语法兼容和数据迁移;面向分布式应用场景,联合分布式中间件推出高性能的分布式解决方案。

最新发布的openGauss 5.0版本,不仅在内核上持续突破,还创新性地提出了DataPod + DataKit的解决方案:在计算池化、内存池化、存储池化三层上进行软硬协同,全栈优化;以插件化架构为主体,定义插件间的标准化交互接口,通过社区协同开发,覆盖部署、开发、运维等6大场景,打造数据全生命周期管理平台。

为了更好地满足行业细分场景的需求,充分发挥openGauss数据库和鲲鹏硬件软硬协同的优势,openGauss社区联合伙伴推出了“全栈可信”、“全栈安全”、“开箱即用”、“极简运维”的数据库一体机解决方案。这个数据库一体机基于openGauss 5.0的DataPod能力与开放的鲲鹏服务器硬件,性能做了专项优化,为客户提供开放、安全、自主创新、长期演进的企业级数据库解决方案新选择。

openGauss打造的DataPod+DataKit全新数据底座与持续优化的四高内核,不仅仅是在数据库技术发展延长线上的添砖加瓦,更是成为国内开源数据库技术发展的重要推动力量。

积极开源,良性生态助推openGauss “枝繁叶茂”

数据库的发展离不开开源社区的支持。开源数据库的发展孕育了大量商业机遇,基于开源项目的创新商业模式层出不穷;同时商业活动的活跃可以反过来刺激开源社区壮大。事实上,开源开放、协同创新也一直是openGauss日渐繁荣的秘诀。

截至发稿前,openGauss开源社区已有290多家企业和机构加入,近5000名开发者参与社区贡献,下载量突破190万次。开源3年以来,openGauss已上线7个版本。DBV伙伴基于社区版发布商业发行版,用户基于社区版深度定制的用户自用版,这些版本已覆盖数字基础设施丰富的场景,包括面向关系型的集中式、KV数据库,地理空间数据库,时序数据库等。

为了提升openGauss社区专业服务能力,openGauss伙伴专业保障服务于openGauss 开发者峰会2023上正式发布。会上,共有八家伙伴成为openGauss社区首批认证服务伙伴,他们是openGauss生态服务能力构建的有力保障,承诺为用户提供高质量、高可靠和稳定的专业服务。

在笔者看来,作为数字平台的核心软件之一,数据库具有非常重要的战略意义,需要长期的投入、技术积累,才能有经受得住考验的产品。openGauss社区通过持续发展、不断繁荣的社区生态,完善了我国在数字建设过程中的关键一环,加快了我国自主创新建设。未来,将持续为客户带来价值,为国内各个行业提供数据库的支撑,为我们国家数字化转型提供强有力的底座支持。

openGauss开源三年来的快速发展,离不开每一位全产业链伙伴的支持和贡献。面向未来,虽道阻且长,但行则将至,也希望openGauss社区可以充分联合社区创新力量,共研核心技术、共创应用示范、共推行业标准、共创国产数据库发展新生态。

推荐阅读
关注数
5070
文章数
454
对数据中心、云计算、5G、AIoT 等科技领域的最新技术和应用的信息交流、新产品新技术的引导、技术创新与品牌打造,降低用户对新技术的接受成本
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息