狒话 · 2020年08月12日

LSI:一个字头的消失

Avago-LSI.jpg
旧文重温:曾经耳熟能详的LSI(Logic),在2013年12月中被Avago(安华高)斥资66亿美元收购之后,回过头来看下面这篇最初发表于2013年1月7日的文章,我已然分析了为什么英特尔(Intel)不会收购LSI,但……Avago我真的不熟啊!还好,该文整体上对想了解这些年存储行业变迁的人来说,仍有一定的参考价值,只是图比较多哦……

Abhi-Weibo.png

摘要:有道是“巨变伤巨头”,思科老大钱伯斯认为未来5年,微软、IBM、惠普、SAP、甲骨文和思科中有两三家将退出巨头行列。规模至少差一个数量级的小公司或许调头快,但往往在所涉行业中以技术先进立足,遇上闪存挑战硬盘这类颠覆性变革,稍有不慎即满盘皆输的可能性更大。如果一家30年还不到30亿的老牌非主流半导体公司,能做到:本是硬盘行业内的重要供应商,在闪存来袭时成功构筑防线,为把优势延续过来赢得时间;因服务器市场需求不足进军存储系统OEM,成为IBM与Dell的主要供应商,却在云计算和大数据浪潮推动服务器与存储融合时果断抽身,并成为Facebook重要的合作伙伴……通过分析一个传统意义上的硬件厂商,应对闪存、服务器与存储融合、云计算和大数据变局的过程,梳理出过去十年存储行业的发展主线,是否也能对我们有所启发?

云计算成为风潮以来,IT行业的氛围发生了很多变化。个人感受最强烈的一点是,现在没有谁是绝对安全的:

  • 与十年前相比,英特尔的至强(Intel Xeon)已成为后端市场上的主导品牌,这一定程度上得益于云计算和大数据,但是前端市场也受到ARM的突袭,市值就被高通超过,唱衰之风四起;
  • 微软的情况是真不妙:据统计,2004年在微软操作系统在消费类计算设备中的份额还高达95%,短短七八年就掉到了20%,这显然要拜包括智能手机和平板电脑在内的移动设备大爆炸所赐;
  • 想想在iPhone之前的最后一款“街机”是谁?我以为是2008年末、2009年初的E71。当时谁能想到,只用了两年的时间,诺基亚就抛弃了Symbian,投入微软的怀抱?而且,这才是噩梦的开始……
  • 庞大如IBM,内部的有识之士也从Nokia的快速坠落,有了强烈的危机感;
  • 相比之下,过去五六年一直在折腾的惠普,居然还没有垮掉,足可见底蕴之深厚了。

FlashBD-01.png
短短八年间,微软在消费计算市场的操作系统占有率下降了75个百分点!不难想见,微软不是在自己的主领地——PC市场被击败,而是PC受到了智能手机、平板电脑的冲击…微软开拓新战场不力,导致总的地盘变小

巨头们的危机源于游戏规则的改变。刚刚转向64位的时候,AMD曾经给Intel制造了不小的麻烦,但事实证明,要想颠覆Intel的霸权,需要一套完全不同的体系——譬如…ARM…

当然话也要分两头说。就单个领先的产品线来说,安全区变薄了:Vista犯下的错误,Windows 7基本可以弥补,但若Windows 8重演Vista那一幕,微软还有机会挽救么?可另一方面,在Windows的传统市场PC萎靡,Windows Phone也未见明显起色的情况下,应用软件(如Office)和Windows Azure等的表现,让微软的小日子过得还行,尚存足够的转圜余地,要全线失守不是那么容易。

道理同样适用于英特尔:至强的强势和先进的生产工艺、强大的生产能力,保证Atom还来得及组织有力的反击。市值有时只是浮云,只要不像前两年的诺基亚那样慌了神自乱阵脚,时间还是有的。

阵地(产品线/解决方案/服务)的厚度和宽度,是巨头的两大法宝(参见HP)。但如果并非巨头,厚度不够,纵有多条线也是关联业务,形势变化怎办?难道一损俱损?

不妨看一个真实的例子:某老牌半导体企业,经过多年的苦心经营,通过并购和甩卖使存储业务占到每年25亿美元收入中的70%,是:

  • 硬盘控制器市场上的前两位提供商之一,特别在高性能硬盘控制器市场占据统治地位——正面临迅速崛起的SSD挑战,发展空间何在?
  • 积极推动SAS成为高性能驱动器接口标准,并成为SAS控制器市场的领跑者——还是SSD“捣乱”,让原本是协作性质的PCIe(PCI Express),有可能压SAS一头!
  • 借SAS的东风,成为服务器市场领先的RAID卡提供商——原本目标用户的需求,要么可以用PCIe SSD取代,要么开始用大量廉价SATA硬盘驱动器,并担心RAID漫长的重建时间……更多的选择,令传统RAID技术的重要性受到质疑;
  • 为拓宽业务进军外部存储市场,一度成为中低端市场上主要的OEM供应商——服务器与存储融合的趋势,使得其最大OEM客户IBM与Dell纷纷另起炉灶……

简而言之,在SSD、服务器与存储融合的大趋势下,围绕硬盘驱动器构建起技术优势(如SAS、RAID)的“传统”企业,该如何化解威胁,把握机会?或许,我们可以从LSI公司的经验和教训中,对行业的发展方向,有一个更清晰的认识。

收购:闪存难挡,选择加持

LSI公司在前仙童半导体CEO Wilfred Corrigan的主导下创立于1981年,EMC、希捷(Seagate)和早期存储标准如SCSI也在1980年前后起家,堪称存储行业发轫的年代。不过,LSI初期的业务与存储关联不是很大,主要是半导体ASIC(Application-Specific Integrated Circuit,一种特定用途的集成电路),并曾活跃于盛极一时的MIPS联盟。上世纪90年代末开始,LSI借助一系列收购,成为存储市场上的核心器件供应商之一。

LSI有两个业务很好的体现了ASIC与存储的结合。其一是硬盘控制器(Hard Disk Controller,HDC),LSI Logic早就是高性能企业级硬盘驱动器市场上主要的硬盘控制器供应商,这个市场不大但缺乏竞争者,利润还算不错。原英特尔数字企业事业部(Intel Digital Enterprise Group)副总裁兼总经理Abhijit Y. Talwalkar(作者注:就是开头微博里提到的Abhi)于2005年出任LSI Logic总裁兼CEO之后,并购了在硬盘控制器市场中出货量第一、收入则少于Marvell排名第二的Agere Systems(杰尔系统)。与当时的LSI不同的是,Agere的存储收入大部分来自为台式机和笔记本电脑的硬盘驱动器提供硬盘控制器,竞争也更激烈。2008年,LSI又收购了Infineon(英飞凌)的硬盘控制器业务,以求得对Marvell的优势。

FlashBD_02.jpg
希捷是高性能企业级硬盘驱动器市场上的王者,也是LSI公司的大客户。这两款2.5英寸15K/10K RPM SAS硬盘驱动器都采用LSI的硬盘控制器芯片(IC),可以看到上面还是LSI Logic的老名字,下面则换成了新的Logo(2007年4月初完成收购Agere后去掉“Logic”,换成了更显生动的图形)。有趣的是,还可以看到老对头Marvell的PRML读/写通道芯片配合工作……

硬盘控制器是负责CPU与硬盘驱动器(Hard disk drive,HDD,通常简称为“硬盘”)通讯的集成电路(IC),对于硬盘行业的重要性可想而知。反之亦然,如果对硬盘驱动器的需求减少,LSI的硬盘控制器业务也会受影响。

在LSI增强硬盘控制器业务的同时,硬盘驱动器的“对手”固态盘(Solid State Drive,SSD)也逐渐成长起来了。与硬盘驱动器相比,基于闪存的固态盘具有很高的I/O性能,劣势在于容量和价格。不难想见,SSD的出现,对一直以IOPS(I/O per second,每秒I/O数)立命的高性能企业级硬盘驱动器是很大的打击,也抢去了PC(笔记本电脑/台式机)上的增长机会,更不要提飞速发展的平板电脑市场了。

硬盘控制器相关业务能为LSI公司贡献四分之一左右的收入,是每年5亿美元以上的“大生意”,不要说萎缩,就是增长放缓,也值得警惕。既然SSD的崛起不可阻挡,打不过不如加入,于是LSI公司在2011年10月底出手,3亿多美金拿下SSD控制器厂商SandForce。

FlashBD-03调整版.jpg
放弃消费电子业务之后,LSI公司有一半的产品线与硬盘驱动器密切相关(硬盘控制器、SAS、RAID),而且都是行业内最重要的供应商。但是SSD的迅速崛起势不可挡,因此对SandForce(虚线框内)的收购至关重要

从硬盘控制器到闪存控制器,LSI做的还是控制器的生意,但“脚踩两条船”,显然安全了许多。SandForce并入LSI公司后成为FCD(Flash Components Division,闪存组件分部),其闪存控制器主打在“计算机”(PC、服务器)的SSD市场,据称份额占到35%。目前SandForce SF-1000/2000系列闪存处理器(Flash Storage Processor,FSP)都采用在驱动器市场(包括硬盘驱动器和同样“驱动器外观”的SSD)占绝对数量优势的SATA接口,也正积极向Windows To Go这样需要高速USB 3.0存储设备的市场拓展。

FlashBD-19.JPG
用于“计算机”(PC、服务器)的SSD到2016年将占NAND闪存市场的20%,而目前LSI SandForce闪存处理器在这个市场的份额为35%

硬盘和SSD两边下注,这样不管哪个市场有增长,LSI都能从中获益。不过,SandForce的加入,暂时还不能很好填补LSI在高性能企业级硬盘控制器业务上可能出现的缺口。

这话是怎么讲的呢?

前面说SF-2000系列都是SATA接口的闪存控制器,细究的话,不能说完全正确。譬如,SF-2600是6Gb/s SATA接口,但又为SAS接口做了优化,包括支持512字节以上的扇区。

FlashBD-04调整版.jpg
SF-2600是“为SAS优化的”(SAS Optimized)6Gb/s SATA闪存控制器,已经部分体现出了SandForce对SAS闪存控制器的态度

一定程度上拜SSD所赐,现在业界兴起4K扇区风,512字节以上了不起嘛?非也,很多企业级存储产品要求硬盘的物理扇区略大于512字节,譬如520或528字节,多出来的部分保存扇区校验信息。作为面向企业级市场的产品,SAS驱动器应该具备这个能力。

SAS是Serial Attached SCSI的简称,它兼容并行SCSI的指令集,借鉴了Serial ATA(SATA)的物理层和FC-AL的双端口特性。SAS技术标准于10年前开始制订,LSI公司是积极推动者之一。如今,SAS已经成功的取代服务器端的并行SCSI(如Ultra320)和存储系统端的FC-AL,统一了服务器与存储系统的驱动器接口,LSI也追随这一变革,只剩下PMC-Sierra一个竞争对手。

这就是LSI另一个很好体现ASIC与存储结合的业务——SAS IC/HBA。采用LSI SAS硬盘控制器的硬盘驱动器,通过LSI的SAS IC/HBA连接到服务器或存储系统控制器的PCIe总线上……看起来,LSI几乎垄断了企业级存储的数据通路。

FlashBD-21.jpg
SAS向下兼容SATA,所以采用SF-2500/2600闪存控制器的SATA SSD可以直接连到SAS IC/HBA上。如果需要SAS的双端口能力,则可以通过LSISS9252这样的转接卡达成

果真如此,为何完成收购SandForce都快一年了,LSI还没有推出一款SAS接口的闪存控制器?闪存控制和SAS接口技术都齐了,“对接”很难嘛?

LSI亚太区闪存存储业务销售总监林治宏的回答是:SAS目前的市场分布比较偏在存储端,市场份额还相对较小,从经济性上考虑,目前是做到SAS整合的程度。也就是说,如果客户有SAS SSD的开发计划,LSI的建议还是以外接的桥接器为主——SAS向下兼容SATA,桥接器可以完成单双端口和必要的协议转换,SF-2600就得益于此。

因为,原来大量使用高性能企业级硬盘驱动器来获得高I/O性能的用户,有了直接跨过SAS SSD的选择——PCIe SSD,或曰PCIe闪存卡。

组合:浑水摸鱼,争取时间

PCIe闪存卡滥觞于Fusion-io,思路很简单:闪存芯片与PCIe总线之间,为什么要经过先通过闪存控制器转换成SAS协议,再经SAS IC/HBA转换成PCIe协议呢?省去两次SAS转换的中间环节,直接用闪存控制器连接闪存芯片和PCIe总线就好了嘛!

Fusion-io.jpg
Fusion-io列出的RAID/SAS控制器桥接方案(上)与原生PCIe控制器方案(下)的数据处理流程对比图。理论上,少掉了不必要的中间环节,确实有助于缩短延迟

这样做起码有三大好处:

  1. 缩短延迟——少了中间环节,延迟自然更短;
  2. 提高带宽——SAS 2.0(单向带宽,下同)为6Gb/s,对高性能SSD已经是瓶颈;PCIe 2.0 x8达40Gb/s,6倍以上;
  3. 简约可靠——只用一个闪存控制器芯片就可以搞定,不需要SAS IC什么的,总体部件更少,节省空间,还有助于提高可靠性。

有道是知易行难,道理都明白,但目前Fusion-io仍然享受着先发优势。林治宏表示,PCIe接口的闪存控制器在SandForce的发展路线图上,但何时推出还不能透露。

FlashBD-20.JPG
SandForce为SSD提供闪存处理器(而不是SATA/SAS SSD成品),而LSI收购SandForce之前就在做PCIe闪存卡——后者市场更大,但若无SandForce的闪存控制器业务作为支撑,不具备真正的竞争力

开发原生(Native,不需经SAS/SATA转换)的PCIe闪存控制器,对于已经有SATA闪存控制器和SAS技术的LSI来说,难度是要大于SAS闪存控制器的。可是市场不等人,架构不先进总好过连产品都拿不出来。因此,在收购SandForce之前,LSI就用自家的SAS IC LSISAS2008加上6个使用SandForce控制器的SATA闪存模块(其实就是SATA SSD),推出了PCIe闪存卡WarpDrive。完成对SandForce的收购之后,LSI又以类似的手法,推出了第二代的Nytro WarpDrive应用加速卡。

FlashBD-06.jpg
Nytro WarpDrive应用加速卡与第一代WarpDrive SLP-300采用相同的架构——通过SAS控制器LSISAS2008,转接几个SATA闪存模块。主要区别在于,闪存模块增加了eMLC,闪存控制器也从SF-1500升级为SF-2500

这么做的还有英特尔,与Nytro WarpDrive同期推出的Intel SSD 910,也用了LSISAS2008,带着最多4个SAS闪存模块(Intel和Hitachi GST合作开发的SAS闪存控制器)。在这种SAS IC + SAS/SATA SSD的组合下,后者接口是SAS还是SATA,基本没有区别。

Intel SSD 910 800GB with LSI SAS2 2008 Falcon Chip.png
经过SAS转换的组合方案会比原生PCIe增加多少延迟?LSI公司加速存储事业部总监Michael Chang认为,决定延迟并不在接口转换,而在于闪存控制器与后面NAND闪存的通讯,这方面SandForce有优势。不过,除了少数对延迟特别苛刻的场景(譬如双十一的淘宝),也颇有人在了解这两种架构的差异之后问:这能增加多少延迟?要求至于这么高吗?

F20 from tbray.org.jpg
Oracle上一代数据库一体机Exadata X2采用的Sun Flash Accelerator F20 PCIe卡,4个采用Marvell闪存控制器的SATA闪存模块,通过LSISAS1068E连接到PCI Express总线上(可以看到卡右侧还遗留了SAS内部连接器)。作为LSISAS2008的上一代产品,LSISAS1068E是一款3Gb/s SAS IC(LSISAS2008为6Gb/sSAS),一方面可见在SAS IC + SAS/SATA闪存模块的“组合”PCIe闪存卡方案中LSI之“无处不在”,也说明Marvell在闪存控制器上的布局要早于LSI(照片来自网络)

LSI公司院士、CIO办公室系统架构师Robert Ober则以美国银行的Jeff为佐证:Jeff是华尔街最有名的架构师之一,他所在的美国银行每年在服务器机房方面的花费大约是50亿美元,同时他还是Fusion-io的技术咨询师。去年11月他参加了美国银行创新峰会,展示了目前市场上PCIe闪存卡的性能图表,他在现场问观众“这些卡的区别是什么?”大家说法不一。他说,对我们现在的应用来说,这些卡的性能都差不多,已经足够快了。我们现在应该专注于做“有用”的解决方案,这就是LSI所选择的方向。现在业界已经有了足够快的方案,但还存在着很多其他问题,这就是系统专家要为客户解决的。

backshot.jpg
独家专访LSI公司院士、CIO办公室系统架构师Robert Ober,和LSI公司加速存储事业部总监Michael Chang。此次会面根据他们拜访百度的时间做了调整,阿里、腾讯这样的大型互联网公司也与LSI有不同程度的合作关系,本文后半部分会谈到相关话题

既然增加这个转换对延迟的影响一时说不清楚,那就看看实际的市场表现吧。Nytro WarpDrive应用加速卡推出以来,赢得了两个大OEM客户:

  1. EMC的服务器闪存缓存解决方案VFCache,入选的PCIe闪存卡还有Micron RealSSD P320h——采用IDT开发的原生PCIe闪存控制器,总体架构更贴近Fusion-io的ioDrive。这样看来,起码EMC还不认为两种架构之间有多大差异;
  2. Oracle的新一代数据库一体机Exadata X3。之前的Exadata,配备的PCIe闪存卡Sun Flash Accelerator F20部分使用了Marvell的技术。能把在闪存控制器上先行一步的“死敌”Marvell踢出局,于LSI也是乐事一件。

FlashBD-08.jpg
Micron RealSSD P320h PCIe闪存卡采用一枚IDT的ASIC作为闪存控制器,直接将美光的闪存芯片连到PCI Express总线上。这个IDT ASIC遵循制订中的NVMe标准,FIO曾是该组织的重点打击对象

当然,就像前面所提到的,LSI很清楚,没有SAS/SATA这个中间环节的所谓Native(原生)PCIe闪存卡是大势所趋,自己推出这样的产品也只是时间问题。问题是组合方案可以争取时间,哪怕只是一两年。LSI/SandForce参与了包括NVMe在内的多个PCI Express SSD接口相关标准组织,个人认为或许一年内LSI就能推出原生的PCIe闪存控制器,毕竟竞争对手如Marvell也不会闲着,譬如Intel的920…?

放弃:RAID与外部存储的回归

十年前,在SAS标准仍处于初创阶段的时候,LSI就通过一年之内的两次收购,获得了AMI的RAID适配器部,从IBM手里拿下了Mylex,大大增强了在RAID领域的实力。

当时LSI在RAID卡领域的主要竞争对手是Adaptec,双方都希望能开拓服务器以外的市场。确切的说,虽然中高端服务器普遍配备SCSI RAID卡,但受Ultra160/320为代表的并行SCSI技术所限,一个双通道的RAID,真正能接的硬盘驱动器数量也不多。这很大程度上促使对存储性能要求较高的服务器,更倾向于使用外部的存储系统(如SAN)——服务器内置的RAID卡和硬盘驱动器,基本只用来安装操作系统和软件。空间受限的刀片式服务器出现后,加剧了这一趋势,甚至索性放弃内置硬盘驱动器,直接从SAN(Storage Area Network,说是存储区域“网络”,但很多语境下简化来指代FC或iSCSI存储系统)启动。

服务器市场对高性能RAID卡的需求不足,而当时的中低端存储系统还没有太多软件功能,其控制器的主要任务也是处理RAID、搬运数据,与RAID卡颇有共通之处。理论上,结合Fibre Channel(FC)、iSCSI等主机接口技术之后,RAID卡厂商做低端存储系统至少没技术障碍。Adaptec先行一步,在2004年以OEM的方式向IBM提供两款iSCSI存储系统,名为DS300和DS400。

也是在2004年,LSI公司把存储系统业务独立出来,成立了Engenio存储部门。此举目的有点不纯——上市,你懂的。但是那两年的金融环境不是很理想,加之OEM业务不容易吸引投资者的眼球,Abhi上任后彻底放弃了这一打算。

小贴士:要明白LSI RAID业务的变迁,有必要不太严谨的说一下RAID与JBOD的关系。从字面来看,RAID是Redundant Array of Independent Disks(独立磁盘冗余阵列)的缩写,JBOD则是Just a Bunch Of Disks的缩写,两者内涵都比较丰富,这里不展开。但是,在很多情况下,我们可以把JBOD理解为很多硬盘驱动器的物理聚合,包括必要的电路连接(如扩展器和磁盘背板)和供电、散热等,而RAID则通过运行在专用处理引擎(如RAID卡或CPU的XOR加速功能)上的软件赋予其智能。这就出现以下几种可能的组合:
* RAID和JBOD都在服务器内部实现,则共同构成服务器的存储子系统——于LSI而言,就是RAID卡业务;
* RAID由存储系统的控制器实现,连上JBOD,则构成完整的存储系统——于LSI而言,就是外部存储系统业务;
* RAID在服务器内部或没有RAID(如SAS HBA),JBOD在服务器外部——譬如,后面将要提到的Open Vault……

FlashBD-09.jpg
RAID卡通过线缆和/或磁盘背板把硬盘驱动器连在一起(后者相当于JBOD),放在服务器内部(上);存储系统控制器包含或基本等同于RAID卡的功能,与JBOD组合在一起,就构成存储系统(下)

目的不纯也要有本钱,当时Engenio已经拿下IBM中端FC存储系统的OEM,号称业界第二大OEM存储供应商。反观Adaptec,因为DS300/400的反响不佳,丢掉了IBM的合同,继而被迫放弃了外部存储业务。Engenio顺势把IBM的低端存储系统业务也接了过来,即DS3000家族。

虽然IPO未成,不妨碍Engenio的业绩斐然。除了IBM的DS4000,StorageTek、Sun、SGI等厂商的中低端存储,主要都OEM自Engenio,包括戴尔低端的PowerVault也是(中端转销EMC),生意红火得很。

FlashBD-24.jpg
IBM入门级存储系统DS3500是Engenio部门的作品(现NetApp E-2600),其控制器(下半部分)相当于一个加强版的RAID卡:核心处理器③是LSISAS2116(右上方圆圈内的芯片),这枚ASIC是集SAS控制器与RAID处理引擎于一身的所谓RoC(RAID on Chip),内置800MHz的PowerPC 440处理器内核,并提供16个6Gb/s SAS端口。而LSI同时期的SAS RAID卡(上半部分)采用的LSISAS2108,处理器内核也是800MHz的PowerPC 440,但只提供8个6Gb/s SAS端口。至于SAS扩展器(SAS Expander④),两者更是一样的LSISAS2x36。顺便说一句,LSISAS2116还用在了LSISAS9200-16e、9201-16e和9201-16i等16端口6Gb/s SAS HBA上,但没有使用RAID功能……如此种种,足以说明LSI的RAID卡与外部存储业务之间的血缘关系

不过好景不长。还记得2009年,我向来京的LSI高管提了一个很长的问题,大意就是:Engenio的OEM客户中,规模小一些的如SGI状况不好,StorageTek被Sun收购,两家变成一家(通常1+1<2),更悲剧的是Sun又被Oracle收购了;大一些的如Dell收购了EqualLogic,肯定大力发展,与Engenio的合作范围不减小就不错……如此一来,Engenio的业务将变得高度依赖IBM这么一个大客户,潜藏着巨大的风险,你们如何应对?

事态的发展很快证明了我绝非杞人忧天:2010年10月,IBM推出以其SVC(SAN Volume Controller)软件为核心开发的Storwize V7000存储系统,面向的市场区间与Engenio提供的DS5000系列(DS4000系列后继产品)高度重合。

LSI的应对之策包括拓展销售渠道,准备通过白盒渠道合作伙伴销售自有品牌的低端存储系统。但是工作还没有铺开,2011年3月初,LSI宣布将Engenio业务出售给NetApp!

饶是问过那样的问题,听到这个消息时,我仍颇感意外。一是不到半年前(2010年12月)的LSI存储论坛上,还提到正在开发基于英特尔至强平台的下一代中端存储系统,NetApp应该不需要这个;二是4.8亿美元的价格与Engenio业务每年能带来的营收相比,有贱卖的意思。

我的问题部分应验——Engenio的生意不好做了。不过我们也不能刻舟求剑,行业环境已是此一时,彼一时。我相信LSI出售Engenio业务,一定也有出于技术发展趋势的考虑。既然如此,对于Engenio这部分业务所对应的市场需求,应该会有填补的手段。

在LSI的大力推动下,SAS成功取代服务器内部的并行SCSI和存储系统内部的FC-AL,统一了服务器与存储系统内部的接口。随后,在Intel的不懈努力下,以至强为代表的x86也在存储系统控制器领域压倒了PowerPC(PPC),有一统服务器与存储之势。

单论RAID处理能力(如XOR和P+Q运算),x86的效率不如PowerPC。但若运行更上层的软件功能如自动分层存储、重复数据删除,甚至跑几个虚拟机,x86在处理能力、发展前景和生态环境上的优势明显。随着存储越来越趋向于成为软件行业,英特尔的强势入侵已不可避免。

换句话说,独立的存储行业,正在演变为在标准化或通用的硬件平台上,比拼专业数据处理能力的软件。LSI擅长的RAID已经“沦为”底层软件功能,缺乏相应的上层软件能力,继续做存储系统生意,竞争优势将不复存在。

FlashBD-11.png
IBM Storwize V7000的控制器,CPU是四核2.13GHz的Intel Xeon EC3539处理器,集成XOR等RAID加速功能,但主要是满足Easy Tier自动分层存储等软件的需要。在这个架构中,LSI只能争取SAS IC + SAS扩展器(红色椭圆框中)的生意机会,丧失了核心地位——事实上,Storwize V7000的硬件业务,由Xyratex承接

从更高的层面来看,云计算与大数据的趋势,推动服务器与存储逐渐走向融合。对服务器厂商而言,一方面,存储系统的硬件平台门槛大大降低;另一方面,必须将存储的核心能力(软件)掌握在自己手里。如此一来,不必也不能再仰仗OEM。纵使软件能力有欠缺,大厂也有更雄厚的财力,通过收购来补齐短板。Engenio现存的两大客户,Dell已经与EMC分手,IBM则在Storwize V7000站稳脚跟之后,将其技术下移,近半年来又推出了与DS3500市场定位重合的Storwize V3700/3500,抛弃Engenio势在必然。可能因为存储实力还不够,Dell仍与NetApp延续着较为紧密的OEM合作关系,但也是早晚的事。

简而言之,以软件为主导的发展方向,不仅让LSI无法体现优势,也促使其OEM客户选择自力更生。二者存其一,就够让LSI做出放弃的决定了,何况双管齐下?OEM是LSI多年来主要的业务模式,像Engenio这样完整的系统级产品,如果找不到OEM客户,即使LSI想自己销售给用户,也不知道该怎么卖。Engenio并入NetApp之后,起码不存在这个问题。

有道是“关上一扇门,打开一扇窗。”服务器与存储走向融合,意味着LSI可以在服务器市场寻觅更多的机会。多端口数的SAS IC和扩展器(SAS Expander),使得服务器内部可以容纳的驱动器数量,大为增加。现在的2U机架式服务器,像IBM System x3650 M4和Dell PowerEdge R720这样的主流产品都能安装16个2.5英寸驱动器,而存储型服务器如Dell PowerEdge R720xd和IBM System x3630 M4,更是可以配置多达26个2.5英寸驱动器,或者14个3.5英寸驱动器。

Dell 13G.jpg
Dell PowerEdge R720(上)服务器可安装16个2.5英寸驱动器,而R720xd(下)正面更是装满24个

服务器内部要连接这么多的硬盘驱动器,对于RAID的要求高过以前,给LSI提供了更大的机会。LSI公司存储解决方案部门执行副总裁Phil Brace就自豪的表示,数得上的服务器OEM,只有惠普用的不是LSI的RAID方案(注:其实前一代产品还是,但现在HP的路线有分歧)。

FlashBD-17.jpg
LSI公司存储解决方案部门执行副总裁Phil Brace原任Intel公司服务器平台部市场总经理,2005年追随Ahbi加入LSI公司

站在存储系统的角度,服务器与存储融合,更“激进”的做法是,根本不用外部存储系统。既然每台服务器都可以接那么多硬盘,用大量的服务器做成分布式系统如Hadoop,还能满足数据尽量存储在服务器本地的要求。而这对LSI来说,相当于是个可以把存储系统“丢掉”的业务“抢”回来的机会。

互联网和大数据的兴起,使得像Amazon、Google、Facebook等互联网巨头,需要大量的服务器。他们的规模大到已经可以考虑自己定制服务器,更直接的向Intel、LSI等组件供应商采购,而无需传统的服务器厂商作为中间环节。一定程度上,他们对LSI这样的组件供应商,依赖度比传统服务器厂商更高。

如果说,对于Dell、HP、IBM等服务器大厂来说,存储业务也完全成了“自家的孩子”,手心手背都是肉。那么,起码Facebook不用考虑这个问题。如果LSI能帮Facebook简单高效的增强服务器的存储能力,他们才不在乎什么存储系统呢。

FlashBD-16.png
NetApp E2660就是原Engenio的高密度存储系统,NetApp的Hadoop开放解决方案(NetApp Open Solution for Hadoop)用E2660通过6Gb/s SAS直连多个数据节点(外部DAS),代替服务器内部的存储,可以提供更好的RAID保护、可维护性和存储利用率

不过,即便对希望把数据就近存储的HDFS来说,能够被几台服务器共享的外部存储仍然有利用率和灵活性等方面的优势。因此,作为折中方案,曾经被SAN“挤兑”多年的DAS(Direct Attached Storage,直连存储)焕发了第二春。SAS是个很好的直连技术(也可以小范围的使用交换机,这个不表),但典型的外部DAS仍是需要具备完整RAID功能的存储系统,而这个业务LSI已经随Engenio一同放弃。不过,LSI有办法——把DAS的RAID功能拿掉,变成JBOD的系统!

FlashBD-12.png
Facebook提出的Open Vault草案是Open Compute项目(OCP)的一部分,能够在2U机架的空间里容纳30个3.5英寸硬盘驱动器,要用到4个28端口(可根据配置不同选择24或20端口)的LSI SAS扩展器。每个SAS扩展器上接出的一个x4外部Mini-SAS连接器可以用来连接一台或多台服务器,两个x4内部Mini-SAS扩展器用来级联其他的Open Vault存储单元。它看起来就像是把存储控制器拿出来放到服务器里(SAS RAID卡或HBA)留下的JBOD,可以抢一部分存储系统的生意(包括已属于NetApp的E-2600系列,如前一幅图)

所以,我们可以看到,在Facebook提出的Open Vault存储单元草案中,是4个来自LSI的SAS扩展器来完成把30个硬盘驱动器(考虑双端口)与服务器连在一起的任务。没有RAID,这就是一个JBOD。那么,服务器用什么与之相连?

  • HDFS可以把一份数据在不同地点(跨服务器、机柜、数据中心)保存三个副本,这样可以不用RAID,但需要具有较多外部端口的SAS HBA,这在HBA中属于高端产品;
  • 大型的存储系统如EMC的Isilon或Atmos,因不能忍受大容量SATA硬盘驱动器漫长的RAID重建时间,选择擦除编码(erasure coding)作为替代。但就服务器内部,以及Open Vault存储单元这种虽有二三十个硬盘驱动器,却可能分属多个RAID卡的情况而言,RAID重建并非不可接受。为了提高存储空间的利用率,从Facebook到淘宝,都越来越认可RAID的价值。

无论SAS HBA还是RAID,LSI都是更占优势的那个供应商。

如果,一部分原来要通过存储系统才能满足的需求,现在用服务器就可以解决;那么,这个存储需求的“回流”,意味着随Engenio一同丢掉的,LSI可以从服务器市场补回来,甚至更多…?!

竞合:守硬件专长,做软件支撑

外部存储系统已经演变成捆绑在标准硬件平台上的软件业务,如果不具备相应的软件能力,那就把硬件做好。

出售Engenio业务,至少从客观上看,由于缺乏新形势下所需的软件能力,LSI放弃了直接做完整系统,提供给OEM客户的路线。专心做组件,至多是子系统供应商。

对于有足够软件开发和整合能力的大型客户,如Oracle、EMC、Facebook,LSI只提供硬件产品如Nytro加速卡、SAS扩展器和RAID卡(固件等底层软件作为硬件的一部分),当然设计上的要求必须满足,还有深度合作开发,但提供的只是硬件,而非软件。

FlashBD-13.jpg
LSI推介其企业级闪存解决方案(左)和HA-DAS(右)的目标市场分析,两个金字塔,有立体和平面的不同呈现,主旨却是相同。金字塔的顶尖,LSI要么只能提供物美价廉的硬件(如高性能PCIe闪存卡),或根本无力染指(企业级数据中心),但金字塔的中下层(中小型企业的目标市场)更大,也更需要LSI的帮助

LSI的子系统级解决方案主要针对更多能力不足的中小型客户,旨在利用驱动程序乃至固件级别贴近硬件的底层软件,譬如缓存功能可以把PCIe闪存卡与RAID紧密结合,让两者各尽其才。增加这些硬件适用的场景,提高系统整体效能,进而扩大市场。典型的例子如2012年推出的Nytro家族应用加速产品和Syncro家族共享存储产品。

Nytro家族已经是LSI的第三代缓存产品。Robert Ober表示,“我们和每一家闪存制造商都有紧密关系,所以我们在SSD控制器市场有很强的存在感,但是你不能用SSD完全取代HDD,真正的创新在于如何将两者混合到一起,优化性能、密度、可靠性、管理,从中创建一个能够真正启用人们所需应用的解决方案。”

他认为,Nytro家族的缓存方案,价值主要体现在两个方面。“一个当然是软件,管理数据所在位置,如何被放置在这,如何利用闪存优化生命周期,需要很多智能的特性。不过也体现着很多硬件的价值,因为如何架构系统不仅仅是加速,而且还可以解决一些问题,例如在服务器发生故障情况下的数据可用性,如何池化资源并将这些有用的闪存资源从一个服务器转移到另一个服务器,如何迁移虚拟机,这样迁移的不仅是虚拟机还有热数据集,你怎么在毫秒级的时间内迁移可能达到TB级的数据?”

FlashBD-14.jpg
LSI的Nytro家族应用加速产品,核心思想是利用PCIe闪存缓存最常访问的热数据(Hot Data),达到应用加速的目的。最左边的Nytro WarpDrive最高端(金字塔的塔尖),OEM客户(如EMC、Oracle)有找出热数据并调度到其上的软件,不需要LSI提供软件;中间的Nytro XD加上了缓存软件,可以对中小型企业的入门级存储(如DS3500/E-2600)上的热数据进行加速;右边的Nytro MegaRAID看名字就知道还有RAID卡的功用,可以缓存服务器本地硬盘(理论上也可以包括外接的Open Vault存储单元)上的热数据……分别对应前述金字塔的中层和下层

我们知道,EMC的VFCache只选择了Nytro WarpDrive应用加速卡(硬件)。“如果让我与EMC等厂商对比的话,我很欣赏它进军这个市场的举动,但我知道,大多数大型企业正在慢慢地淘汰他们的SAN。EMC的问题在于,他们正在尝试用缓存把SAN推向服务器,在服务器中管理数据,而我们的方法是将数据放在临近应用的地方,让SAN消失、变得对应用透明化,让人们获得价值、敏捷性、SAN的可管理性,摆脱陈旧的基础设施。”那么,Nytro XD特别是Nytro MegaRAID离实现这一愿景有多远?

FlashBD-25.jpg
Syncro构建在LSI的MegaRAID技术之上,让多个MegaRAID控制器协同工作,构建存储共享功能,让DAS走出机箱,实现服务器之间的共享,即所谓共享DAS(shared DAS,sDAS)。LSI宣称这一架构带来五大好处:1.提高存储利用率,2.提高应用的正常运行时间,3.降低成本,4.降低故障率,5.降低能耗

如果可能,LSI不想放过任何可以挖外部存储(包括SAN)墙角的机会,至少希望把入门级外部存储的RAID控制权抢过来,由服务器里的RAID卡负责。一定程度上顺着Open Vault的思路,LSI希望把小规模高可用性(HA)集群使用的共享存储,也变成直连的DAS——确切地说,还是SAS JBOD。外部DAS的成本降低了,但LSI的SAS扩展器仍有用武之地,更重要的是证明提供外部SAS接口的RAID卡具备更高的价值……

FlashBD-15.jpg
高可用性(HA)方案通常需要至少一台共享的外部存储系统(左),而LSI的HA-DAS(高可用性直连存储,右)架构,相当于把外部的共享存储由RAID降级为更简单的JBOD,由于服务器台数不多(面向中小型企业的入门级方案),还可以把SAN换成DAS,理论上又省下了存储交换机的钱。但是服务器的花费可能会增加,因为(SAS或FC)HBA要换成支持外部SAS接口的RAID卡。目前基于该思路的Syncro共享存储产品有双服务器RAID卡(目前是LSI Syncro CS 9286-8e Solution)配JBOD和单机箱双系统集群(Cluster-in-Box,由OEM客户销售)的方案

原则上说,LSI的HA-DAS解决方案并不依赖于具体的操作系统,但是其基于MegaRAID SAS 9286CV-8eCC RAID卡的LSI Syncro CS 9286-8e解决方案,目前声明支持的操作系统仍只有微软Windows Server 2008 R2和Server 2012。Phil Brace表示,LSI的确是在与VMware合作一些特殊的产品,还不方便透露细节。“但是我可以告诉你的是,对于Syncro来说,我们的目标市场可能比VMware所推出的产品目标市场范围更小一点,因为我们的产品更多的是关注小的零售店和中小企业,还有一些超大型数据中心(注:用Syncro MX满足),而基本上这些用户装的VMware产品数量并不是特别多。所以我们觉得VMware的产品环境更多的是适用于一些更高端的市场,至少要比我们这个市场层级更高的市场。像我刚才所描述的那样,我们希望今后能够推出更多的产品,能够适用于VMware的产品环境。”

FlashBD-26.jpg
与Syncro CS相比,Syncro MX有点反其道而行之的意思——这个1U的机架引导设备,可以连接多达48台服务器,用其RAID 10卷保存48个独立的引导卷。也就是说,整个机柜内的服务器,都可以不用本地存储了。如果将整个机柜看作一台刀片式服务器,那么Syncro MX-B就是其共享存储。当然,Syncro MX的核心仍然是LSI擅长的RAID和SAS相关技术,在操作系统下的硬件层面解决问题,因而对主机系统是透明的

确实,以HA-DAS的定位,面向的市场多以Windows Server为平台构建小型的高可用性环境。现在VMware还不能很好的覆盖这一市场,不过已有了一些初步的尝试,譬如其vSphere Storage Appliance(VSA)虽然定位不尽相同,但顺着VMware软件定义存储(Software Defined Storage,SDS)的路走下去,类似于HA-DAS的功能完全可以在vSphere操作系统之上的软件层面(如VSA)——而非之下的偏硬件层面(如HA-DAS的RAID卡)实现。固然,同样的功能由硬件来实现会具有更高的效率,却也要面对灵活性等方面的质疑。无论如何,作为底层的硬件供应商,LSI应该与VMware这个企业级操作系统市场上的新贵有更密切的合作。

Phil Brace对此表示认同:“我们现在正在创建一个独立的部门,这个部门就是由我们的一些人员和专门的资源、专门的工程师所构成,这个部门主要工作任务就是深入到我们的客户中去,比如像VMware、微软、Oracle这样的客户,专门跟他们打交道。具体的了解他们需要我们为他们做些什么,之后我们就知道我们能够为他们做些什么。在此基础上,我们在提交产品和技术解决方案的时候,能够让我们的产品更加无缝的与他们的产品进行连接。”

与直接竞争对手Marvell和PMC-Sierra相比,LSI公司因涉足存储领域较早,存储业务所占比例越来越高,特别是还做过存储系统的生意,相对更善于与最终用户沟通,也懂得如何宣传解决方案。但是,归根结底,卖掉Engenio之后的LSI,仍是一家半导体公司。Phil Brace在回答我问题的时候也承认,“我们在做Engenio业务的时候,最大的挑战是Engenio是一个系统的业务。当然我们自己了解出售它背后真实的故事,但是很多用户和投资者不理解,为什么我们会有这样的举动。他们不知道对于LSI来说,出售这个业务的话,到底对于我们的系统和半导体业务意味着什么。但是我想告诉你的是,LSI更多的还是关注我们的半导体业务,我们是一个半导体公司。”

在叫嚣软件为王的时代,承认自己是家半导体公司并不丢人。Intel也是家半导体公司,但云计算和大数据的腾飞,离不开以至强家族为代表的CPU给力。问题在于,LSI从规模和影响力上,都无法与Intel相比。

不过,做同一个大行业(半导体),不意味着大鱼可以吃掉小鱼。LSI的核心业务如SAS和RAID,Intel都曾经认真的想要做好过。先说RAID:2001年,Intel通过现金加股票收购了在高性能RAID卡开发上颇有造诣的德国公司ICP vortex,比LSI收购AMI RAID适配器部门和Mylex还早,Intel IOP(I/O处理器)在RAID卡市场的采用率更是超过LSI。不过,只过了两年时间,Intel就把ICP vortex出给了LSI的竞争对手Adaptec(现属于PMC-Sierra),IOP家族也在转入SAS时代后,经过IOP348(代号Sunrise Lake)的多次跳票,逐渐凋零。

说到SAS,本来比RAID更贴近Intel的核心业务(“继续专注于核心产品的研发”是其出售ICP vortex时的理由)。2003年春,SAS标准刚刚进入草案阶段,我一句“个人认为SAS技术比并行SCSI更便于芯片组集成,有没有想过,如果Intel这么干了,你们的HBA业务怎么办?”问得在座的LSI公司高层哑口无言……在2012年推出的至强E5平台上,Intel真的这么干了!值得LSI庆幸的是,C600芯片组集成的SAS非常不给力!!所以,至今在SAS和RAID上,LSI仍是Intel最亲密的合作伙伴。(关于Intel为何搞不定SAS,请参考我2012年的文章“Intel的搞不定与不搞定”)

FlashBD-22.jpg
采用36端口(LSISAS2X36,上)和24端口(LSISAS2X24,下)SAS扩展器的服务器磁盘背板。在SAS架构中,扩展器起着交换机的作用,使得SAS HBA/RAID卡能访问的驱动器数量大为增加

这意味着LSI的SAS和RAID产品可以继续搭至强平台的车通行无阻,但Intel的CPU技术对LSI却没有什么利用价值。正如前面所说,如果使用至强等主流的x86处理器,这行业基本就变成软件业务了,LSI没法玩。LSI的ASIC需要处理器内核,可直到目前Atom仍不是做控制器的料——如果能行的话,LSI的情况恐将大大的不妙。

正如前面所说,LSI是二十年前曾活跃一时的MIPS阵营的一员,现在又高度依赖于PowerPC,不幸的是这二者的发展前景是五十步笑百步。有处理器架构师背景的Robert Ober承认这一点,他表示:“我们有MIPS许可,但MIPS有些过时了,PowerPC做的很好,对于网络业务是很重要的。但是,做磁盘控制器也很重要,我们也参与了一些ARM的开发工作,长期来看,这是我们的发展方向。PowerPC的确有一些性能局限性,但我们集成了它强大的引擎。所以我们的硬件可以轻松应对百万IOPS,没有服务器和应用能够创造那么多流量,我们只对某些控制特性利用这种处理器,奇偶校验、数据纠错、数据流,这些都是自动的硬件,不是性能的问题。我们的确有迁移到ARM上的计划,这对我们的产品线来说更加方便,最重要的是运行在这些处理器上的软件,从这一点上来说,我们的客户不关注运行什么处理器,只要软件和性能都是他们所需要的。”

FlashBD-23.jpg
LSISAS2X36与LSISAS2X24,其Fusion-MPT架构基于ARM内核

在并行SCSI时代LSI就已采用基于ARM的Fusion-MPT架构,沿袭至现在的SAS IC/RoC/扩展器产品线。从长远来说,LSI将更多地使用ARM,也更倾向于使用ARM(特别是相对于生态系统越来越弱的MIPS,PPC的发展路线亦不够明晰)。但是RoC核心的计算引擎,会否从PowerPC换回ARM,Robert Ober没有明确回答。

LSI是一家半导体公司,其核心竞争力是面向硬盘/闪存控制器、SAS、RAID等特定存储应用的ASIC。除了不断根据应用和行业的变化调整自己的布局,让持有的产品组合覆盖尽可能大的市场,继续身体力行的推进相关标准,并为ASIC们找到一颗适用的“芯”也是LSI长久发展的要点之一。

7 阅读 404
推荐阅读
0 条评论
关注数
1581
内容数
33
云计算、基础设施、大数据领域的技术话题
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息