申耀的科技观察 · 2023年06月09日 · 山东

华为云GaussDB:共建繁荣数据库生态,推动数据库产业变革创新

当前数字化浪潮席卷现代社会的每一个角落,以数据作为关键生产要素的数字经济时代,数据库技术不仅成为数字产业化的核心关键技术,同时也构成了新型基础设施建设的坚实底座。同时,作为企业的核心系统之一,数据库也是企业级用户交易数据、客户信息、存货库存等海量数据的载体,可以说数据库产业发展的成败事关国家的战略全局。

但也要看到,在中国科技产业的发展过程中,基础软件领域一直是一大“短板”,特别是在高端数据库市场,由于起步较晚,导致这个市场一直以来都被国外品牌所“垄断”,因此业界也就有了“撼山易,撼O难”的戏称。

这种被动的局面即将被改写——6月7日,在华为全球智慧金融峰会2023上,华为常务董事、华为云CEO张平安正式发布了新一代分布式数据库GaussDB,其具备高可用、高安全、高性能、高弹性、高智能以及易部署、易迁移特性,并且经历了全球最大银行核心系统的苛刻验证,这也标志着在基础软件领域,源自中国本土市场公司自主创新的分布式数据库无论是其技术领先性,还是在市场实践和验证方面都走到了全球的前列。

正如张平安所言:“我们希望通过攻坚克难,哪怕这个市场只是数据库产业中‘塔尖’上的一点点,华为也愿意坚定的投入,这是GaussDB的定位,同时通过持续的创新,GaussDB能够给世界一个更优选择。”

毫无疑问,给世界一个更优选择,同样也是这个时代的必然选择,背后不仅是相比传统的集中式数据库,分布式数据库的优势尽显;更重要的底气则是源于GaussDB的技术优势让其具备了更为强大的竞争力,因此有信心在未来能够在世界范围内参与数据库市场的“角逐”,而这也正是GaussDB引领时代,更创造时代的真实写照。

国产数据库迈入新阶段

作为新一代分布式云数据库,GaussDB通过多维度的技术创新,在行业实践中构筑了高可用、高安全、高性能、高弹性、高智能的技术优势,而在数据库替换场景中,又具备易部署、易迁移的特性,客观说GaussDB能够实现这种技术突破性可谓“难能可靠”,也在中国数据库发展历程中留下了“浓墨重彩”的一笔。

为什么这么说呢?背后的原因在于,目前国内数据库市场其实主要可以划分为“存量替换”和“增量市场”两个部分,其中,“增量市场”主要以开源语法兼容为主,绝大部分业务逻辑在应用中实现,对数据库能力要求相对较低,很多开源数据库产品也能满足。对数据库厂商来说,增量市场研发投入相对较少,因此大部分新兴分布式数据库厂商都在追逐这个市场,这也过去几年国内数据库市场“百花齐放”的底层逻辑。

而“存量替换”则是大多数国内企业,尤其是大型企业遇到的真正难题,因为绝大部分大型企业的核心业务系统都运行在功能强大的集中式商业数据库上,目前面临着原有数据库系统无法升级的困境,存在License过期的风险,而数据库这种关键系统要进行重构又存在成本高、风险大的问题,再加上集中式商业数据库发展时间长,功能灵活、语法支持多等,都对分布式云数据库的兼容能力设计提出了极大的挑战。

以金融行业为例,金融业本身就是数据密集型行业,同时随着过去几年移动互联网和电子支付的蓬勃发展对金融系统能力带来全新的挑战。最为典型的是,是金融行业的数据量急剧增长,对数据存储和管理提出了更高要求,同时面临高并发业务和大用户量带来的系统压力,这就要求移动应用响应速度更快。但目前我国绝大部分金融核心还运行在大型机系统上,而且往往也都采用集中式商业数据库,因此要通过分布式云数据库实现替换升级,可谓是“牵一发而动全身”。

这个过程中主要面临的难题可以从几个维度来看,首当其冲的是分布式事务的一致性保证,也就是高可用性,对于单机较容易实现的ACID,分布式环境中往往容易出现了更多的难题。这是分布式数据库将需要处理的事务进行拆分,再部署到不同的服务器上进行处理,理想状况下,整个过程需要全局一致性协议的保护,而分库分表两阶段的方式在一些意外情况下容易出现问题。

在性能和可扩展性方面,当前各厂商在进行分布式改造时,很多分布式数据库的架构要么是对中间件负担过重,可扩展性较差,要么是在多并发和低延时上还存在升级改造的空间等等。

此外,运维管理方面,相比传统的集中式数据库,分布式数据库对运维也提出了更多的要求,例如,基于分布式数据库分片特性,需要更准确地管理不同节点不同类型的数据表;基于分布式数据库多节点特性,运维节点的数量也大幅增长;基于分布式数据库架构特性,运维过程中更加需要注意节点故障中留存的数据不一致问题。因此,这就需要数据库厂商能够提供全生命周期的运维管理工具,覆盖迁移、开发、运维全流程等工具。

最为致命的还是数据库的迁移,众所周知将数据从传统集中式数据库迁移至分布式数据库是一项复杂且庞大的工程。企业对于能否在不影响业务的条件下,实现安全的无损迁移,是至关重要的。同时,高度的商业数据库兼容能力意味着大量的设计和研发工作,涉及产品整体架构的多个方面,十分考验厂商对底层数据库代码的理解和掌控能力。

由此可见,要在“存量替换”市场中赢得企业级客户的认可和信赖,并非一日之功,而华为早在2001年就开始战略投入数据库,经过20多年的技术积累,并融入华为长期以来对企业服务的质量与可信规范,这也让GaussDB不仅完全解决了大型企业客户从集中式数据库走向分布式数据中遭遇的“痛点”,撬开了过去难以撼动的“存量替换”市场。

也正因此,GaussDB的这种技术创新和突破真正让国产数据库迈入了一个新时代,可以说这不仅是GaussDB数据库自己的胜利,也是其所代表的中国科技公司的胜利,更是中国在基础软件“根”技术领域实现重大突破的胜利。

引领时代更创造时代

事实上,GaussDB之所以在中国的数据库创新的历程上具有重要的价值意义,关键在于其不仅打造了“五高两易”的特点,同时其在实践验证和生态构建方面也同样取得了重要的突破和进展,这也让GaussDB不仅引领了时代,更创造了时代。

首先,从技术创新角度看,从芯片、服务器、存储、网络,到操作系统、数据库、编译器和语言,GaussDB是当前国内唯一能够做到软硬协同、全栈自主的数据库,而这种全栈软硬件“自研”,不仅造就了GaussDB的独特优势,同时也打造出了“五高两易”的特性。

所谓“五高两易”指的是高可用方面,GaussDB创新了存算分离架构,采用华为云底座存储硬件级、实时数据同步复制技术,并结合分布式强一致算法,实现了分布式架构下同城双集群、双活备份,可在突发状况下确保数据零丢失(RPO=0)。同时,该架构也可确保单集群的Bug风险半径可控,各集群软硬件可以分别独立升级和修复;高安全方面,GaussDB作为业界首款纯软全密态数据库,在安全上,GaussDB一直引领产业趋势,国内首个拿到国际CC EAL4+认证的数据库,这是安全领域的最高认证。

此外,在高性能方面,GaussDB打造的Ustore存储引擎,从数据库自研内核架构实现创新,确保了数据库高性能,极低抖动;高弹性方面,GaussDB基于原生分布式架构,能够实现云化弹性伸缩、秒级扩容,业务扩展不断服;而高智能方面,指的是GaussDB在应用开发阶段,提供SQL的全量全链路感知、分析及优化能力,为客户提供易用、高效的应用开发体验;在运维阶段,基于覆盖全流程的监控、智能化诊断能力,提供快速精准感知恢复的智能运维体验。

而在易部署、易迁移方面,GaussDB则构建了一站式的迁移自动化工具链,通过自动语法转换工具UGO、数据迁移工具DRS、流量回放建模工具等,让传统数据库更容易更平滑的迁移到GaussDB上,相比传统作业模式,应用改造成本降低90%以上,这种一站式服务真正让企业的数据库替换工作实现了迁移无忧。

其次,从实践验证角度看,GaussDB不仅在华为内部IT系统中历经考验,同时在多个行业核心业务系统也得到了广泛应用。以华为内部IT系统为例,GaussDB已完成600多套数据库的全面替换;在华为终端云,已建设6000多个分布式数据库节点,承载高达6个PB数据。

在行业市场,华为与中国邮储银行合作,邮储银行向华为开放了6.5亿用户的银行分布式新核心系统建设机会,其系统中即使用了GaussDB。目前,该系统已全面投产上线,可实现日均20亿笔交易、峰值6.7万笔/秒的能力,新系统效率平均提升40%。

数据显示,目前GaussDB已广泛应用于金融行业,支撑了中国工商银行、中国邮政储蓄银行、中国建设银行、中国农业银行等国有大行的核心业务。此外,也服务了陕西省财政厅、中海油、国家管网、国网陕西电力、首都公路发展集团等关系到“国计民生”的关键行业。

最后,从生态构建角度看,数据库行业发展40多年来,比拼的不仅仅是技术创新能力,更是生态的竞争能力。在这方面,GaussDB持续扩大伙伴生态圈,已与上下游80+伙伴提供200有竞争力的联合解决方案,涵盖数据库迁移、备份恢复、容灾、一站式运维、数据库咨询服务、数据库培训等,也与行业内知名伙伴公司建立面向客户的应用系统。

回头来看,正是GaussDB全栈软硬件“自研”这种独特优势,让其无论是在兼容性适配还是产品能力的研发上能够更胜一筹,加上实践验证和生态构建方面的突破,也让GaussDB在带动中国数据库乃至基础软件领域发展方面起到更大的作用。

共建繁荣的数据库生态

面对世界百年未有之大变局,国家在“十四五”期间把科技创新摆在发展全局的核心位置,并提出要加快关键核心技术攻关,而GaussDB此时提出了“给世界一个更优选择”的新口号,在这背后不仅证明了GaussDB可以更好地服务好中国的企业客户,也预示着GaussDB吹响了重构数据库市场格局的“新号角”,未来中国的数据库厂商也能够和世界顶级数据库厂商同台竞技,“一决雌雄”。

一方面,从国产化“替代”视角看,在基础软件行业,操作系统、数据库是基础软件产业的核心控制点。数据库更是被业界誉为“软件皇冠上的明珠”,足以见其重要性和复杂性。因此,这些核心技术如果某个节点被“卡脖子”,可能就会影响整个国家的社会经济命脉。

而目前国内很多金融机构或者很多“国计民生”关键行业的数据库系统仍然选用集中式数据库,或者技术国外的技术平台搭建,在当前复杂的环境下,供应链风险不可忽视,自主创新至关重要、迫在眉睫。

而GaussDB通过持续的技术创新,在很多关键业务场景中已能够实现“替代”甚至超越国外的产品,其价值不仅在于为关键行业的客户的数字化转型提供了一个安全可控的平台选择,更让中国在数据领域领域的自主创新迈上了一个全新的高度。

另一方面,从全球竞技的视角看,由于国内庞大的人口基础导致包括金融、电信等关系到“国计民生”的重点行业,无论是其关键应用的规模还是其数据的体量都在全球领先,这都让这些行业面临“世界级”的数据处理压力,而传统数据库的性能往往无法满足这种规模的处理需求,因此也让越来越多的行业用户从集中式数据库走向了分布式数据库。不仅如此,在Gartner日前发布的《市场份额:2022年全球数据库管理系统》中,基于分布式云构建的数据库厂商已经占据了TOP10中的“半壁江山”,这也体现了未来走向分布式云数据库已是行业大势所趋。

而GaussDB更大的优势还在于,它不仅历经了众多中国大型企业客户的苛刻验证,同时目前亚洲的很多银行已经开始选用和测试华为云GaussDB数据库,在南美也有很多客户开始测试。可以说,面向新时代,分布式云上的数据库一定是一个更新的、更优的选择。同样,GaussDB从中国的创新场景走向全球的客户,也是这个时代必然的选择。

当然,虽然中国数据库产业迎来了巨大的市场发展空间,尤其是面向未来的云化、分布式等方向有很大的创新与领先机会,但同时也存在着一些现实的问题和挑战。对此,张平安在本次大会上也提出了关于中国数据库产业创新突破与健康良性发展五点建议,包括:联合技术创新,实现数据库核心技术的突破和创新超越;攻关典型场景,客户开放更多场景,实战中打磨可靠产品;优化产业环境,打造健康的数据库商业模式和产业环境;打造繁荣生态,加速应用迁移,确保系统稳定高效运行;培养关键人才,产教融合,保障开发者和创新人才供给。

与此同时,更为了更好的推动数据库产业的繁荣发展,华为云GaussDB还与金融行业用户、行业伙伴、产学研各界各方携手合作,发起了三大产业行动。其中,生态合作方面,华为云携手17家软件伙伴企业、7家服务伙伴企业,共同启动了“GaussDB数据库金融行业生态发展计划”;产业合作方面,华为云联合中国工商银行、中国邮政储蓄银行、中国人保、华夏银行、北京金融科技产业联盟、新意科技、海量数据等15家产业伙伴共同发起“促进数据库产业发展倡议”;下一代数据库产业技术难题方面,华为云与包括清华大学、北京大学等11所高校的教授共同发起“数据库产业技术难题揭榜”;此外,GaussDB持续重视人才培养,通过产教融合等方式,培养未来数据库产业人才,保障人才持续供给。

总的来说,无论是从短线看帮助中国关键行业客户化解数字化转型中的“挑战”;中线看国内数据库行业坚持自主创新,实现国产化替代的必要性;以及长线看整个数据库产业从集中是走向分布式云数据库的发展趋势,都需要更多的中国数据库厂商有所作为和担当,而历经二十年磨一剑打造的新一代分布式数据库,具备“全栈全硬件自研”优势的GaussDB,通过与产业各方合作,共建繁荣的数据库生态,相信在未来可以更好地推动千行百业的数字化转型,推动中国乃至全球数据库产业的变革与创新。

推荐阅读
关注数
2384
内容数
379
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息