在今年的“开放数据中心峰会”(ODCC)现场,我们看到了一组非常重要的展品——符合OTII-E标准的边缘服务器。OTII是ODCC推动的众多项目中的典范,曾经在2023年被票选为“ODCC十年卓越项目”。在ODCC 2025中,英特尔重点展示的是边缘侧的AI推理场景,并发布了《OTII-E边缘AI推理一体机》白皮书。
OTII(Open Telecom IT Infrastructure,面向电信应用的开放IT基础设施项目)是一个服务于中国市场边缘侧需求的开源项目,于2017年由ODCC与英特尔、中国移动、中国电信、中国联通、中国信通院,以及十几个服务器厂商共同发起。到目前为止,OTII已经有40多个成员,设计了三大类解决方案:面向边缘高性能计算的OTII2U,面向边缘低成本5G的OTII1U,面向边缘的模块化融合方案的OTII-E(OTII-Extension)。
从项目名称和发起成员可以看出,OTII在立项之初主要面向电信运营商在5G边缘场景中网络与计算融合的需求,为接入、边缘网关、计算和存储等提供统一融合平台。OTII可以在紧凑的空间内提供较高的性能密度、存储密度和网络接入能力。过去五年,除了在运营商得到广泛应用,OTII也被众多企业青睐并在企业边缘大量部署。不过随着AI推理需求的广泛发展,用户对实时性、数据隐私、节省带宽等方面的要求,企业部署边缘侧推理算力的需求也在不断增长。英特尔针对这种趋势,进一步优化了AI算力在边缘服务器中的集成。以英特尔与ODCC这次合作展示的样机为例,它在不到半米见方的空间内即可以部署3块双宽GPU卡,单卡功耗可以达到450W,AI算力相当强劲。
如何实现模块化?
英特尔展示的这款OTII-E样机是来自云尖信息的E2400边缘服务器,基于OTII-E规范研发。机身尺寸(87mm高×447.4mm宽×470mm深)适配19英寸、600mm短进深机柜,采用前维护结构。计算节点(网元)、扩展模块、IO端口等都在正面。尾部则是4个8056风扇模组和双冗余CRPS标准电源。考虑到边缘侧场景对可靠性、静音方面的需求,服务器内的CPU、GPU都可兼顾被动散热或主动散热方案。
OTII-E的“Extension”在这款机器上如何体现呢?我们可以先看看标准文档中规划的前面板布局:
左侧Flex区域是灵活配置区,云尖信息E2400为这个区域准备了两种模块:交换网络模块,或4盘位2.5英寸存储。
面积最大的区域理论上有全宽和半宽两类模块,在云尖信息E2400上则设计为两个半宽区域,规划了若干种半宽、1U或2U高度的模块。譬如可以是4个1U半宽的计算节点,或2个2U半宽的计算节点,也可以是1U或2U的半宽扩展模块(PCIe Riser或者4个2.5英寸盘位)。每1U半宽的扩展空间可以是2个全高PCIe+2个E1.S,或2个半高PCIe+2个水平布置的2.5英寸热插拔盘位,或4个2.5英寸热插拔盘位。
这款服务器比较典型的几种模块化配置是AI密集型、计算密集型、存储密集型、ICT融合型。其中:
- AI密集型配置一个2U半宽计算节点和一个2U半宽PCIe Riser模块。前者下半部分主要是单路至强处理器和8通道内存,上半部分可以安装一块双宽GPU卡和2块E1.S SSD;后者可安装两块双宽GPU卡。3块GPU卡均可配置PCIe 5.0 x16接口。
- 计算密集型则是4个1U半宽计算节点,共4颗至强处理器、32槽内存扩展。不再提供全高PCIe扩展。
- 存储密集型是两组1U半宽计算节点,以及4组2.5英寸盘模块,加上Flex区域就是12个2.5英寸盘位,两块主板上还能提供4个M.2盘位。
- ICT融合型是两组1U半宽计算节点,以及两组半高PCIe Riser+2.5英寸盘模块。每个计算节点本身带了双口网卡,还可安装一个OCP网卡,再加上3个半高PCIe,那就是(1+1+3)×2=10,可以实现图片中介绍的10网卡。
进一步分解
样机配置的计算模块都是2U高度的,上半部分是双宽全高的PCIe Riser,这与英特尔在ODCC上重点展示的边缘侧推理需求匹配。上部1U区域除PCIe扩展外,还有2个E1.S SSD盘位,强化了计算节点的高性能存储能力。
下部1U区域底部是主板提供的RJ45网络(包括双口网卡和一个管理口)、USB等接口;上方是一个OCP网卡和一个半高PCIe扩展。
从内部看,CPU散热器只占用1U高度,支持270W以内的英特尔第四代/第五代至强可扩展处理器,8通道内存。主板上提供了2个M.2接口,支持板载SATA或NVMe M.2 SSD。还有多个MCIO x8接口可以扩展PCIe Riser、SSD等。计算节点的内部还支持一张内置Mezz网卡。
云尖信息E2400的背板区域支持4个节点的接入。每个节点的接插件部分包括1个电源(黑色)和2个信号,接插件区域还安排了定位销引导节点准确插入。背板上还有2个MCIO接口(上图左上角)用于连接Flex模块。背板另一侧则负责充当后置的风扇板。
2U半宽计算模块和PCIe Riser模块的组合,就体现了至强平台的PCIe扩展能力:单个计算节点就可以安装3块双宽GPU卡,每个插槽都可以提供PCIe 5.0 x16的带宽;还有板载加前置共4个NVMe SSD;外加Flex模块的支持。为了满足多卡的功率要求,云尖信息E2400可以选配两个3200W的CRPS电源,1+1冗余。
边缘侧推理的多元算力
前面拆解的两台云尖信息E2400分别是双节点(1 CPU+1 GPU)和单节点(1 CPU +3 GPU)的配置,它们都是英特尔规划的OTII-E边缘AI推理一体机的典型形态。
其中,单节点方案提供的1颗CPU和3块GPU卡可以部署多个不同规模的模型,譬如可以将智能体代理、RAG这类业务放在拥有AMX加持的至强处理器中,在将语音识别、文本转语音这类神经网络模型安排在一块GPU卡中,另两块GPU卡则负责大语言模型。单节点也可多卡并行服务一个较大规模的服务,既可以是更大参数规模的模型,也可以是为了服务更高并发数预留更大容量的KV Cache空间。
双节点方案则更强调的是线性的扩展能力,模型可以根据业务需求,通过分布式框架调用包括CPU和GPU在内的算力;也可以将每个节点独立,以负载均衡的方式接受上级节点的调用。
结语
英特尔积极推动的OTII-E边缘服务器的模块化设计让计算、网络、存储等能力按需组合,灵活支持多样化的边缘侧需求,强化了边缘服务器高可靠性、高性能、高适应性、高性价比的特点。
从算力角度看,OTII-E边缘服务器既可以支持1至4颗CPU的通用算力,也支持多块GPU卡在内的异构AI算力,可以满足不同领域的通算与智算融合需求。企业级用户的边缘侧AI业务往往需要满足实时性、隐私性的要求,必须按需整合包括神经网络、大语言模型,以及向量数据库等业务,堪称麻雀虽小五脏俱全,既要足够稳健,又要足够敏捷,可以说OTII项目的演进对此功不可没,正是它提炼、汇集了电信运营商、企业与OEM/ODM厂商的技术、经验,推动了边缘侧算网融合与变革,也促进了高质量算力服务的普惠。