在 SOC 各种总线中,AXI 是最重要的总线,没有之一。不管是在工作中,还是在面试中,AXI 协议是一个必须精通的知识点。ARM 从 AMBA1 到 AMBA5 一共五代的 AMBA 总线中,AXI 有两代,分别是 AMBA3 的 AXI3 和 AMBA4 的 AXI4。AXI3 和 AXI4 的区别在协议里当然可以找到对应的部分,但是真正的理解和总结 AXI3 和 AXI4 的文...
Arm 凭借在技术生态系统中所处的独特地位,对全球半导体供应链有着全盘了解,并在数据中心、物联网、汽车、智能终端等各类市场深入布局。基于此,Arm 对未来技术的发展方向及可能出现的趋势有着广泛而深刻的洞察。我们将分三期内容为你详细列举从人工智能 (AI) 到芯片设计,再到不同技术市场的主要趋势,带你深入了解 2...
“你买的 4090 多少钱?”、“H100 性能真厉害!” ,GPU 的价格性能一直是大家乐于谈论的话题,作者也经常可以在茶余饭后听到这样的讨论。在热火朝天地谈论性能指标、价格以外,本着”知其然也要知其所以然“的道理,作者学习整理了 GPU 本身的工作原理,编程模型,架构设计,在这里将我的学习笔记整理成文与大家分享,希望与...
“每天用手机刷视频、打游戏、扫码支付的你,可能从未意识到:掌心里的这块‘玻璃板’中,藏着一座堪比北京地铁网的超级迷宫——它就是手机芯片(SoC)。
随着芯片设计向异构组装和 3D-IC 技术迈进,提供和管理电力已成为芯片制造中的核心挑战,显著增加了设计复杂性,迫使制造商在性能、可靠性和成本之间进行艰难权衡。
SM8650 平台上,GLES 发送给 KMD(GPU 驱动)的 GPU 命令有两种类型:同步命令和绘制命令。
真空中光速为299,792,458米/秒,目前,Intel的i7频率可以达到4GHz,简单换算一下,可以得出结论:光(电流)在一个Cycle内移动的距离约为0.075米。显然,目前的内存条的芯片(反正两面。约为3.75cm)大大超过了这个长度,换句话说,理论上,在一个Cycle内内存条上总有一个位置是我们无法触摸。
最近浏览文章发现了一个非常棒的开源AMBA代码生成工具:GitHub - adki/gen_amba_2021: AMBA bus generator including AXI4, AXI3, AHB, and APB
2024 年,Marvell 在其分析师日活动中推出了具备革命性创新意义的 Structera A 内存扩展控制器。
DeepSeek R1 的完整训练流程核心在于,在其基础模型 DeepSeek V3 之上,运用了多种强化学习策略。本文将从一个可本地运行的基础模型起步,并参照其技术报告,完全从零开始构建 DeepSeek R1,理论结合实践,逐步深入每个训练环节。通过可视化方式,由浅入深地解析 DeepSeek R1 的工作机制。
今天给大家带来 DeepSeek 推荐的开源项目,因为有些项目已经失效了,所以会替代为一些相近项目。
众所周知,随着芯片越来越大,功能越来越丰富,以及移动市场的切实需求,低功耗的芯片设计,越来越受到推崇。这里,结合多年的低功耗设计经验,把一些理念和方法,分享给各位。 通过一些理论书籍,大家都知道功耗的来源主要分为两种,一种是动态,一种是静态。
随着信息技术的飞速发展,集成芯片和芯粒技术正在引领半导体领域的创新。集成芯片技术通过缩小元器件尺寸和提高集成度,实现了电子产品的微型化和高效能化。与此同时,芯粒技术通过先进的封装工艺,将多个功能芯片紧密集成成系统级封装(SiP),进一步提升了系统的集成度和整体性能。这两者共同推动电子产品朝着更高性能...
在《AI 时代的高端文件存储系统:IBM、DDN、Weka 和 VAST》中我讨论了一些知名的文件存储,LLM 大模型的热度,确实促进了非结构化数据容量和性能的需求。而今天我要跟大家聊的是块存储(SAN),特别是在云计算兴起之前,多数的交易型结构化数据,比如关键数据库等大都放在上面。
「迷思」是指经由人们口口相传,但又难以证明证伪的现象。由于 GPU 硬件实现、驱动实现是一个黑盒,我们只能通过厂商提供的 API、经过抽象的架构来了解并猜测其原理。因此坊间流传着各种关于与 GPU 打交道时的性能迷思。比如「移动端的瓶颈是带宽」、「移动端不需要太在意 Overdraw」、「植被需要做 PrePass」等等。这些...
信号完整性(SI)在芯片设计中日益成为关键议题。随着芯片设计的复杂性增加,尤其是在多芯片和高级封装方案中,信号完整性面临着更为严峻的挑战。
今年V3/N3已经发布,但考虑到没有公布太多的细节,我依据手册在“ARM发布新一代高性能处理器”一文中对微架构有阐述,本文主要简单分析ARM V2的一些微架构内容。
PCI Express(PCIe)总线诞生的年代,个人电脑中的扩展插槽数量与 CPU 时钟速度或系统 RAM 数量同等重要。从那时起,PCIe 总线就从一组用于插入扩展卡的插槽发展成为一种高速互连拓扑结构。
今天小编给大家带来的是来自美国的Maker Rob Lauer的基于树莓派5的蜂窝网络项目,了解如何为新的 Raspberry Pi 5 单板计算机添加低带宽蜂窝连接。
在数字芯片设计中,几乎所有模块都会涉及到队列管理。输入输出的管理、不同数据流的调度、乱序数据的重排序、不同模块的同步处理、资源管理,等等,均会涉及到队列管理逻辑。如何选择合适的硬件逻辑,对模块的微架构有较大的影响,需要基于具体需求做综合权衡后再做选择。本文简单罗列几种队列管理逻辑,均是个人曾经实...