近期,zStorage分布式块存储系统在海光+麒麟+E810网卡环境下,使用FIO工具测试4K单并发随机读/写IO时,延迟达到4ms。而这里唯一的变量是E810网卡;如果采用Mellanox网卡,在同样的测试用例下,IO延迟约为100us左右。那么问题出在网卡吗?还是另有原因?以下是分析和探索的过程分享。
部分要点目录统一SP5插槽& 向前兼容第五代EPYC型号命名规则、型号列表“G”&“P”links 32G Serdes定义:IF、PCIe、CXL和SATA什么是GMI-Wide高带宽模式?支持几个CCD?一天之前,准确说是在美国时间的10月10日,AMD正式发布了代号“Turin”的第五代EPYC 9005系列服务器CPU,其中包含有使用Zen 5和Zen 5c两种核心的型号。EPYC 9...
上周我分享了FMS 2024会议的资料,唐杰总留言说 “给写个导读呗”。说实话看资料也是个耗时间精力的活,比如去年我工作比较忙,所以三大技术会议除了分享资料之外,好像当时只写过一篇相关的解读文章《SSD也要看互联网风向标 - 来自SNIA的FMS资料》。下图就是从中截的:
目录-为什么是LLM大语言对话模型?-测试项目:token/秒(平均延时)、首个token延时-官方对比测试数字——补充参考-当iGPU性能达到CPU Core 10倍…-测试平台:不完美有不完美的价值-更多发现、总结与展望
在IB/RoCE网络环境中,经常会遇到一些网络相关的配置不当问题,这些问题可能导致性能出现降级。本文对这些问题做一个总结,以供记录备忘。
思考1:Xeon 6 E-Core“小核”服务器,定位的行业似乎比较明确;思考2:我上一次尝试在1U和2U服务器中使用同一款主板,好像是快20年前了…目录- Front I/O前接线,与传统Rear I/O支持- OCP标准化模块:BOSS-N1 DC-MHS和DC-SCM board- R770 / R670 CSP服务器主板差别有多大?- Xeon 6 SoC不再需要PCH芯片组,简化主板设计之...
目录- Quad Rank相对Dual Rank MRDIMM的性能优势- TFF 2U高度内存尺寸改进散热密度- MRDIMM功耗接近翻倍:RCD & DQ Buffers影响较大- MRDIMM对液冷服务器友好?这种新型服务器内存,在SK Hynix网站(如下图)上叫MCRDIMM(Multiplexer Combined Ranks DIMM),而在Micron网站上称作MRDIMM(Multiplexer-Ranks DIMM),其实是...
最近我试用了2款基于LLM大模型+RAG知识库的商业软件,按照发布的时间排序,也按照字母的缩写,分别称为F家和L家吧。
背景:在撰写本文的分享之前,我就已知有一些不完美和遗憾之处,这次希望能达到抛砖引玉的效果。欢迎大家提出自己的建议、可以在下面给我留言。
对于Intel Core CPU性能的进一步挖掘(Turbo/超频),在近几年又恢复了一些热度。记得我在《让45W TDP CPU__稳跑75W__的秘密》一文中讨论的,还只是一款10代U的轻薄移动工作站。事实上,后来55W TDP的HX高性能笔记本CPU,通常也能跑到更高的功耗。至于台式机,从散热和供电上可发挥的空间应该更大。(_注:本文主要讨论...
毫无疑问,GPU和AI加速器才是AI时代算力的最大提供者。训练AI模型需要GPU的超大算力,但一块GPU越来越存不下今天的模型,互联多块GPU成了刚需,各种高端的网卡,DPU也诞生了。推理AI模型也需要非常高的算力,同时对存储带宽的要求也越来越高。即便是端侧,这几年移动GPU和NPU的进步,AI的部署也大多从CPU侧迁移到更大算...
引言:在拟定了本文的题目《AI PC选型指南》之后,我觉得这个帽子可能有点大,所以就在后面加了个 (1)。这样后续我就可以再不断补充,另外说实话一次的篇幅也感觉不太够。我想把本文推荐给所有关注用PC跑“端侧”大模型的朋友,即便您能拿到官方的参考数据,我也建议您再看看这个测试。我先针对CPU(包含iGPU集成显卡)来...
本文内容,来自蚂蚁集团异构计算与推理引擎负责人-赵军平老师,在AICon全球人工智能开发与应用大会上的演讲ppt。
我在昨天的撰文《VMware分层内存愿景:NVMe与CXL Accelerator方案》中,刚发过SNIA 2024 Compute, Memory, and Storage Summit的资料,今天这篇我也是整理自这次会议中的一个演讲。
这是2024年的春季,一年一度的SNIA Compute, Memory, and Storage Summit(CMS,计算、内存和存储峰会)在线上举办。我又当了一把资料的搬运工,同时我还想写两三篇技术分享。
今天分享的是2024 OCP Storage Tech Talk 的演讲资料,官网来源是[链接],也有qiang外的视频。唯一美中不足的是,ppt(pdf)只有一个单文档,把全部议题合并在188页里面了。于是我做了一个拆分的动作,希望对有些朋友带来方便:)
编者注:按照惯例,R670和R770这些命名应该属于Dell PowerEdge 17代了。当然我并不确定这款服务器的具体发布时间,也没看到它的结构设计是否只有下面这一种版本。
前些天看到一篇不错的技术博客。由于我早年搞过一些服务器系统内的散热测试,但对机箱外——也就是数据中心整体的冷却方案只是一个旁观者。我趁机补习了少许知识,今天决定还是给大家写点分享。如有错误和不足之处欢迎专家朋友们指正。
去年的OCP EMEA区域峰会是在布拉格举办,今年在葡萄牙首都里斯本,都是好地方。2024 OCP EMEA Regional Summit演讲资料网盘分享 [链接]提取码:18qd官网来源:[链接](内含视频链接,qiang外的)附:部分往届峰会资料《2023 OCP Global Summit会议资料分享》《2022 OCP Global Summit会议资料分享》《2021 OCP Global Su...
随着"信创"的东风吹遍大江南北,各家公司都开始了国产化的适配道路。zStorage团队当然也没有缺席,去年我们适配了华为的鲲鹏架构,整体性能水平达到了Intel架构的70%以上。今年我们开始着力于海光CPU架构的适配。与鲲鹏架构相比,海光的适配难度相对更小。因为海光也是x86架构,海光CPU通过与AMD的合作,获得了ZEN1架构...