申耀的科技观察 · 2022年11月24日 · 山东

OceanBase社区版4.0:引领时代,更创造时代

今年8月10日,在2022 OceanBase年度发布会上,OceanBase 4.0首次亮相,在经过85天的快速升级迭代,且历经内外部客户的场景测试与真实业务场景的稳定性“打磨”之后,OceanBase 4.0将“简单易用”的应用感受留给了客户。

而在日前举办的2022 云栖大会上,OceanBase 社区版 4.0(代号小鱼)宣布正式发版,它不仅与企业版拥有同等性能,更兼容、更易用,同时更能在2分钟内完成快速部署,这也意味着业内首个兼容MySQL的单机分布式一体化数据库成功上线。

测试数据显示,在同等硬件环境下,OceanBase社区版4.0 Beta的TP性能是 MySQL企业版8.0的1.9倍,而AP性能是Greenplum 6.22.1的5至6倍。换句话说,OceanBase 社区版4.0既能够稳定可靠应对OLTP核心业务场景,也具备强大的OLAP实时分析场景能力,是真正能够处理OLTP与OLAP的单机分布式一体化数据库。

从这个角度来说,OceanBase社区版4.0的正式发版意义重大,特别是在全新的数据时代,在数据类型新、数据分析新、数据负载新的挑战之下,OceanBase社区版4.0真正打破事务处理和分析之间的“壁垒”,能够在同一个数据库中,提供更为高效的“实时业务”决策,帮助企业更好地实现数字化转型,走向商业成功。

更为关键的是,作为业内首个单机分布式一体化架构,OceanBase社区版4.0既可以支持业务最初仅使用单机进行部署,同时更具备单机到多机水平的扩缩容能力,这也标志着在基础软件领域,源自中国本土市场公司自研的企业级原生分布式数据库无论是其技术领先性,还是在市场实践和验证方面都走到了全球的前列。

同样,这也让中国基础软件产业在世界范围内具备了更为强大的竞争力,在未来能够以更强的实力与底气参与全球化市场的“角逐”,因此这也正是OceanBase一直以来引领时代,更创造时代的真实写照。

以快打慢

作为全球首个兼容MySQL的单机分布式一体化数据库,OceanBase社区版4.0最大的“亮点”在于,它与企业版拥有同等性能,具备单机数据库高性能、低成本与分布式数据库高可用、可扩展的双重技术优势,且更兼容、易用,同时更能2分钟内即可完成快速部署。

也正因此,自OceanBase社区版4.0 Beta(公测)11月初正式亮相以来,整个国内的开发者对此给予了高度的关注,不少开发者在OceanBase社区版4.0正式发版当晚,就连夜“肝”起了这款软件的部署和安装,不少开发者在体验完了OceanBase社区版4.0之后,同样也给出了非常高的评价。

比如一位开发者就表示,OceanBase社区版4.0给了他非常大的惊喜,其中在“快速部署及易用性方面”,相比传统的数据库在安装时对环境要求比较高,部署过程较为繁琐,非常耗时等“痛点”,OceanBase“全家桶”的安装由原来需要5步手动安装部署,优化为3个步骤,简单明了,两分钟即可以完成体验demo;除此之外,OceanBase“全家桶”安装包中还包含了OBD、OBProxy、obagent、Grafana 和 Prometheus等工具,且各个工具各司其职,无缝配合,这有有助于开发者更好的使用OceanBase社区版4.0,大大提升了产品的易用性。

另一位开发者则对OceanBase社区版4.0的体验更加“细致入微”,他关注到了OceanBase社区版4.0在文档和学习手册方面等“细节”工作,此前缺乏高质量的文档一直是国产数据库的十分重要的“短板”,而这次OceanBase社区版4.0无论是在产品说明、部署手册、参考手册、管理员手册乃至开发手册等方面不仅“一应俱全”,且能够让开发者全面了解OceanBase社区版4.0文档体系,因此他对OceanBase社区版4.0的文档体系评价是“挺有用的”。

正所谓“见微知著”,从两位开发者对OceanBase社区版4.0的“体验”感受来看,这次为了进一步降低用户的使用门槛,OceanBase 社区版 4.0 在“易用性”上“下足了功夫”,特别是针对传统分布式数据库非常复杂的架构设计及部署难度,OceanBase 社区版 4.0 通过“一体化”极简安装包,将所有组件提前做好适配测试,并给出推荐组合版本,让组件之间的依赖变得简单。

在此基础上,面向刚接触分布式数据库的用户场景, OceanBase 社区版 4.0 也提供一键安装命令“obd demo”,这样让用户也能快速安装OceanBase集群 demo环境,跳过集群的复杂配置步骤,避免用户因不熟悉配置参数导致集群配置错误以及最终安装失败,同时仅仅只需要2分钟即可完成全部的部署工作,实现了让用户更快速、更便捷上手OceanBase的目标。

事实上,数据统计也显示,自2021年6月开源后,OceanBase的GitHub单日最高Star、Fork和Commit数值,均明显高出PostgreSQL等流行数据库,而此次OceanBase社区版4.0正式发版,以其更好的“易用性”无疑会让OceanBase的项目活跃度实现进一步的提升。

客观地说,进入数字化的全新时代,企业商业模式的胜负从过去的“大鱼吃小鱼”转变成为了“快鱼吃慢鱼”,而OceanBase 社区版 4.0在“易用性”上的提升以及安装部署时间的“缩短”,本质上都是为了降低门槛,帮助企业和开发者能够更快地上手数据库,而这种一种“以快打慢”的方式,在改变了传统数据库非常复杂的部署方式的同时,相信也能够更快地加速企业数字化转型的步伐。

以小见大

当然,OceanBase 社区版 4.0最大的技术突破性还在于,其基于单机分布式一体化的架构,为企业提供一个面向未来的数据发动机。简单来说,它能以更强的OLTP及OLAP性能,帮助适合分布式场景的大型用户;同时也其“小型化、小规格部署能力”,帮助适合单机场景的中小规模用户,以及可能会在未来某个瞬间迎来业务爆发式增长的初创企业,都能更好地驾驭“数据库”的能力,具体来说:

一方面,从更强的OLTP及OLAP性能来看,针对OLTP应用场景,OceanBase 社区版4.0全面开放了MySQL 兼容能力,全面兼容 MySQL 8.0 协议,大幅提升 Online DDL 能力,支持超大事务,支持主键变更、主键增删改等。此外,在多租户的核心能力方面,首次将 IO 纳入隔离体系,并将集群级别粒度的备份能力细化拆分到租户级别粒度,最小可支持按租户级别的备份及恢复。

与此同时,OceanBase 4.0借助全新的底层架构,也全面提升数据库的读写性能,在交易处理场景下,全新设计的融合日志缓冲区将同时支持聚合提交和分布式共识协议,显著减少内存拷贝和 CPU 指令开销,让 OLTP 性能有 1 倍以上的提升。

针对OLAP应用场景,OceanBase 4.0将完全自主设计的向量化查询引擎全部开源,加上行列混存能力的引入,可以极大提高 CPU 单核处理性能,实现复杂查询分析性能提升 4-5 倍。

点击添加图片描述(最多60个字)

其中,在计算层,OceanBase全面开放了向量化引擎,以Architecture aware的设计改造了全部的算子和绝大部分常用的执行表达式,充分发掘现代CPU的cache特性以及优化指令;而在存储层,OceanBase提前对数据进行计算或过滤, 从而减少无效数据的处理,提升计算效率;此外,OceanBase还开放行列混存存储引擎, 支持列编码技术,在读取数据时可只对需要的列进行读取,减少读取的数据量。

另一方面,从小型化、小规格部署能力来看,OceanBase 4.0为了实现单机分布式一体化,创新地引入了“自适应日志流”技术。所谓“自适应日志流”技术,是一种融合了服务器级静态日志流(典型代表如 MySQL、PostgreSQL)与分区级静态日志流(典型代表如 CockroachDB)的方案:当系统处于稳定状态时,每台服务器的日志流数量是固定的,但发生迁移时这个对应关系会改变,支持将一个分区从一个日志流迁移到另外一个日志流,从而实现在线水平扩展。

由此带来的好处是,它实现了在线水平扩展的同时不增加分布式相关overhead,从而能够像集中式数据库一样部署在小规格的服务器上,做到单节点性能达到甚至超越集中式数据库的水平。可以看到,OceanBase社区版4.0同样也能支持超大事务、RTO 时间降低到 8s 以内、NTP 服务依赖优化、支持分区数量能力上限等版本基础核心能力的构建,这也意味着 OceanBase 4.0 突破了分布式数据库的边界,让分布式数据库向通用性数据库又迈进了一步,即使是普通的个人电脑也可以流畅运行OceanBase社区版4.0,真正让分布式数据库真正做到“触手可及”。

不难看出,无论是初创企业,到中小规模用户再到大型企业用户;无论是单机还是分布式多机;无论是OLTP核心业务场景还是OLAP实时分析业务场景,OceanBase社区版4.0基于全新的“单机分布式一体化的架构”,以“一站式”的方式解决了各类企业各类数据的管理需求,不仅让众多的企业有了更好的数据库选择,同时其架构独特性和技术原创性更实现了对整个市场的创新和引领。

以简驭繁

值得一提的是,OceanBase社区版4.0还在“用起来”和“用得好”两个维度进行了迭代和优化,真正帮助企业和开发者以更低的成本,更好的运维方式实现对数据库的“以简驭繁”。

所谓“用起来”,指的是在今年的云栖大会现场,全托管的OceanBase Cloud 4.0也正式开放“邀测”。4.0公有云支持小规格,从4C16G到62C400G提供更多规格选择,同时也大幅提升可观测性,让运维更简单,更低成本更强性能帮助客户云上创新“降本增效”。

据了解,OceanBase Cloud拥有 OceanBase 100% 的能力,可以让更多中小企业在云上更便捷、更低成本地拥有高性能数据库,同样也最快仅需几分钟即可在云上完成数据库设置,它的优势主要体现在:

首当其冲的就是具备极高的性价比,OceanBase Cloud的多租户能力,能将企业多个传统集中式数据库实例整合至一套或少量OceanBase集群,最大化提升资源利用率;在高弹性方面,OceanBase Cloud利用OceanBase自身的透明可扩展、透明分布式能力,并结合云上资源易获得的特点,打造出了高弹性的解决方案;此外,支持跨云架构的“统一”,OceanBase Cloud也是真正可以运行在多云上的跨云原生分布式数据库,可以帮助企业从容地实现跨云的数据搬迁、跨云的数据容灾等能力,总之OceanBase Cloud 4.0能够让企业只需一次选择,便可“终身受用”。

而“用得好”,除了前文所述的OceanBase社区版4.0在“易用性”上做了全面的优化之外,在运维方面同样也实现了全新的迭代和升级,包括支持全链路追踪,支持 SESSION 状态的监控和诊断(ASH),标准化视图优化,支持 Schema History 回收功能,支持自动清空回收站功能等等。

以全链路追踪为例,OceanBase社区版4.0设计了一套全链路追踪的机制,能够提升全链路问题定位的效率,贯穿从业务 APP>客户端驱动(JDBC, OCI)>代理(OBProxy>数据库节点(OBServer)到全部流程,能够有效的帮助运维人员降低运维难度,更好的驾驭全链路OceanBase数据库。

总的来说,“魔鬼都在细节里”,从OceanBase社区版4.0的这些技术创新之中,可以看到OceanBase社区版4.0真正极大地降低了用户使用和运维分布式数据库的门槛,其释放出来的价值在今天也显得格外的重要——无论是从短线看帮助中国企业从容化解数字化转型中的“挑战”;中线看国内基础软件行业坚持自主创新,实现国产化“替代”的必要性;以及长线看中国数字经济崛起的大趋势,在这背后都需要更多的中国基础软件厂商有所当担和作为。

而作为业内首个单机分布式一体化数据库,OceanBase社区版4.0中所呈现的“以快打慢”、“以小见大”、“以简驭繁”等等强大的能力,相信在未来都可以更好地推动中国企业的数字化转型,并引领和驱动整个中国数据库乃至基础软件行业能够更上层楼,其价值也可以总结为:“不止于眼下,更关乎未来”。

推荐阅读
关注数
2383
内容数
377
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息