申耀的科技观察 · 2021年03月25日

星环科技“七剑下天山”,做数据世界超高速引擎

毫无疑问,随着云计算、大数据、人工智能、物联网等新技术在各行各业更加广泛的普及与应用,在催生越来越多数据量产生的同时,也让数据的管理和价值挖掘变得愈加复杂和困难。 可以看到,未来大量数据不仅来自数据中心内部,也分散在各种的边缘设备上;同时,数据不仅仅是完成存储就万事大吉,还要支持智能化的管理和分析;此外,数据还需要在本地数据中心与云之间,甚至是多个云之间自由流动,以确保数据始终随时可用等,这种前所未有的变化,也意味着数据管理乃至整个数据基础设施迎来了一个关键的重构期。

星环科技创始人、CEO孙元浩

在此背景下,3月24日,星环科技举行2021线上发布会,发布包括支持10种主流数据模型的多模数据平台、数据云产品、分布式关系型数据库、实现AI建模的全生命周期管理人工智能等产品的新版本,希望帮助行业客户更好的发掘和释放数据资源的潜在价值,推动数字产业化和产业数字化,推动数字经济和实体经济深度融合,助力经济体系的优化升级。 在这背后,正是星环科技一直以来在数据领域“与时俱进”积极响应用户需求的最新举措,也是其跟随新时代不断进化和迭代的具体体现,更是公司为实现创立之时的初心——为数据世界打造一个超高速引擎的最佳印证。相信这种持续的前瞻力、创新力和产品力,将为星环科技在市场中实现“长跑”乃至“领跑”起到更加至关重要的作用,也会为更多企业可以更简单、更从容的实现数字化转型打造新一代的数据技术底座。星环科技“七剑下天山”事实上,星环科技在过去八年的时间里,通过不断的创新和迭代,不仅从整体上重新构建了自身的大数据技术栈,推出了一系列企业级大数据服务和应用的管理平台和解决方案,同时更成为国内极少数掌握大数据核心技术的公司,真正在中国基础软件领域打造出了一张“新名片”。 截至目前,星环科技在四大领域“沉淀”出了众多产品线,其丰富的产品组合以“七剑下天山”的方式,可帮助行业客户快速构建数据湖、数据仓库、数据集市、实时计算系统、数据中台、机器学习、知识图谱、边缘计算、高并发数据应用、交易与分析混合型数据应用、数据云等应用,具体来看: 首先,在大数据基础平台方面,作为星环科技大数据技术栈中的“主力担当”, TDH自2013年发布以来历经多次迭代,而每年的大版本升级都会带来创新的架构思路和性能升级,其中最新发布的TDH 8.0版本,首次把多模型数据平台的性能发挥到了极致。

对此,星环科技创始人、CEO孙元浩表示:“TDH 8.0通过八种异构存储引擎支持业界领先的10种存储模型,此外还提供了统一的SQL编译器、Transwarp Quark、统一的计算引擎、统一的数据存储管理系统、统一的置换调度器等,相比上一个版本更增加了时空数据库、事件存储、键值存储等,这样就可以更好的支撑用户各种高阶的数据分析场景,真正实现多模型技术架构和统一的数据管理。”其次,在大数据云平台方面,2018年星环科技发布的TDC大数据云平台也经历了较大的升级,其最新版本TDC 2.4基于云原生技术不仅实现了分布式计算与存储的解耦合,更完成了计算单元和存储单元的独立弹性伸缩,在支撑有状态的工作负载的同时,也更能满足企业与日俱增的数据处理与管理需求。 “这种弹性和自动伸缩的能力,能够帮助大型企业更好的打造数据云平台,既可以管理好各种数据资源,也可以把大数据和AI等服务能力以弹性的、便捷的方式,按需的对内部进行提供,最大化的释放数据的价值。”孙元浩说。 第三,在数据开发与智能分析方面,星环科技发布了为数据全生命周期管理提供一站式数据开发与治理平台TDS 2.2版本,与上一代版本相比,新增了两个子产品,包括数据质量管理工具 Governor以及数据商城 Transwarp Foresight,更好的帮助企业实现数据治理和数据资产平台的建设。 而星环科技Sophon 2.7 LTS版本,则为企业提供了数据、信息资产和智能设备的全链路AI方案,全面覆盖AI模型和数据全生命周期,支持从数据导入、数据探索、数据预处理、特征工程、模型训练、性能验证、模型部署、模型管理的全流程,真正实现AI建模的全生命周期管理。

最后,在分布式关系型数据库方面,这也是本次星环科技升级中的“重头戏”,其中分布式分析型数据库ArgoDB3.0相较于2.0版本,性能再度提升达到5倍以上。同时,ArgoDB 3.0采用和TDH 8.0一致的技术架构,可以更好地满足了数据多模、联邦计算的需求。此外,分布式交易型数据库KunDB 2.0在性能上同样提升显著,与1.5版本相比,KunDB 2.0在TPC测试中的成绩也提升了接近两倍。 在此基础上,星环科技基于自身在大数据人工智能企业级基础平台及丰富行业落地案例的优势基础上,还倾心研发的一款面向高校、大型企业大数据与人工智能人才培养,集理论教学与动手实践为一体的一站式综合实训平台Transwarp University Online(简称TUO),该平台配套星环大学团队累计超过五年持续打造的丰富课程资源,助力企业、高校快速构建大数据人工智能人才培养体系。 由此可见,星环科技全新发布的TDH 8.0、TDC 2.4、TDS 2.2、Sophon 2.7、ArgoDB 3.0、KunDB 2.0以及TUO等丰富产品组合以“七剑下天山”的方式,在企业数字化转型中能够“各显神通”、“各司其职”,真正为各行各业打造了新一代的数据技术底座。打造新一代数据技术底座那么,这次全新发布的产品组合为何能够被称之为“新一代数据技术底座”呢? 在孙元浩看来,这是因为这一系列产品组合融入了星环科技多年来打磨沉淀下来的先进性技术,包括领先的分布式系统软件技术、优秀的分布式编译技术、领先的分布式数据库技术、数据全生命周期的开发和管理技术、基于容器的数据云技术以及支持计算智能、感知智能、认知智能、行为智能的机器学习技术。

“星环科技作为分布式软件系统研发提供商,拥有天然的底层硬件基础,我们的创始团队拥有丰富的编译器经验和分布式架构经验,可以写出更高效的软件代码,更好的发挥软硬件优势,这些都是我们不断沉淀出先进性技术的关键所在。”他说。 而这些先进性技术,不仅让星环科技在市场中建立了强大的市场竞争力,更在市场上一次又一次树立了创新的标杆,而这个过程并不是“一蹴而就”的,一路走来可以说充满了各种争议和挑战。 孙元浩告诉我:“我们每次做出重大选择的时候,都被人说我们是走错路了,比如星环科技创立初期,全力地对Spark引擎进行改造,并推出了Inceptor分析型数据库,正是基于此数据库,星环科技在TPC-DS测试中登顶数据库领域的最高峰。” 类似的例子还有很多,再如针对Hadoop框架中的“YARN资源调度系统”,星环科技早在2014年年底就抛出一个观点,认为这种传统的调度器应该被抛弃,因为技术架构一定要很漂亮、很简洁才是有生命力的,搞得很复杂、应用又很窄的技术架构一定没有市场出路。也正是基于这样的考量,星环科技从2015年开始投资研发了基于云原生技术的云操作系统Transwarp Cloud Operating System,并在2017年全部完成底层基础架构的重构,而这一次技术方向的判断和投入,由此奠定了星环科技在数据云领域的行业领跑地位。 “在此过程中,公司内外部的阻力都很大,直到2017年我去国外出差,有国外的客户明确表示希望采用我们的技术架构,因为此时全球只有星环科技一家在做容器化的改造,才从侧面证明了我们选择的方向是正确的,而这件事情其实一直争论到2019年年底,友商才接受容器化的方向是一次革命性的变化,但毕竟为时已晚,我们的友商直到现在在技术上都还没有新的进展。”孙元浩说。 因此,这也使得星环科技是世界上第一个能够用容器并发系统来实现大数据资源调度的公司,同时也是今天全球市场上目前唯一一家能够实现把大数据、AI和应用以容器并发系统来提供支撑的公司。

客观地说,没有一个企业走向成功的道路是平坦而不曲折的,同时它也很难从教科书上找到“标准”的答案。所以,企业必须要有去采摘悬崖边那朵玫瑰的勇气,才有资格拿到通往成功道路的通行证,而回顾星环科技过往八年的技术创新历程,无疑就是上述这段话的最佳印证。 我们知道,过去在大数据基础软件领域,国内软件公司基本都集中在应用层,底层大数据平台主要采用国外开源软件集成和封装,再加上整体起步较晚,技术上也很难获得市场和客户的信任,而星环科技在过去八年,通过自身“一步一个脚印”的技术创新和迭代,则完成了这种技术上的“跨越”,不仅打造了新一代数据技术的底座,同时更以“先进性技术”的领先优势站上了大数据领域的创新高地。做数据世界的超高速引擎孙元浩表示,星环科技创立之初定下的两大目标:一是希望星环科技把数据处理引擎做的像光速一样快,因此公司起名为“Transwarp”,而“Warp”本身就代表了“曲速”的含义,这是一种超越光的速度;二是希望打造一个数据平台能够实现数据处理的全生命周期管理,所以公司的“主力担当”产品也被命名为Transwarp Data Hub,其意义指的就是“大数据集散地”,它不仅能够处理所有数据,也能涵盖数据的每个阶段,还可以通过星环科技提供的“一站式”平台直接获取。

回头来看,星环科技当初定下的目标如今都基本实现了,无论是坚持自主研发路线,实现新技术的革新,完成诸多国外产品的替代;还是早于国外同行2年完成大数据组件的容器化部署,成为业界第一个基于容器化的大数据平台;以及成为首个登上数据库“珠穆朗玛”的大数据平台等等,这些成绩都进一步说明了星环科技通过不断地努力,让中国在基础软件,特别是大数据领域也有了绝对的技术实力和能力。 更为关键的是,这种坚持自主研发的路线仍在不断的延续,从星环科技最新公布的大数据技术架构演进图中也能发现,越来越多的组件正在变成绿色,这也意味着星环科技的代码创新度和自主可控程度都在持续的增强。

展望未来,孙元浩认为星环科技在国家大力发展数字经济的过程中,也将可以贡献出更多的价值。一方面,在企业数字化转型领域,目前业界已经形成的共识是,一定要把数据基础设施的地基打牢,然后再建设数据湖、数据仓库,或者建数据云,而星环科技丰富的产品线可以帮助企业实现数据的全生命周期管理。 另一方面,随着国家越来越重视软件国产化,特别是基础软件的国产化,对星环科技而言也是一次重要的历史性机遇。可以看到,过去八年时间星环科技已在中国市场积累了众多的客户,并且覆盖到了各行各业,在很多关键业务场景中已能够实现“替代”甚至超越国外的产品,这同样也印证了星环科技的产品是具有领先优势的,而随着海量数据的增加,以及更加复杂的应用提出的新挑战,也都会给星环科技更多证明自己实力的机会。 “我们始终是一家技术驱动的公司,今后也会坚持把技术做到最好,把客户服务做到最好,在数据驱动的新时代,能够更好的贡献出我们的力量,成为一家有价值的大数据公司。”孙元浩最后说。 从这个角度来看,有数据的地方就需要有星环科技,而星环科技的技术创新步伐同样也“从未止步”。可以期待的是,在未来数据驱动的新世界中更大的创新力、想象力和实践力,也正等待着星环科技去再定义、再创新和再开拓。

推荐阅读
关注数
2384
内容数
381
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息