超神经HyperAI · 2023年11月21日 · 广东

英伟达中文官网删除4090,芯片出口禁令范围扩大,A40、A6000赫然在列

01 美国商务部对中芯片出口新规正式生效

当地时间 11 月 16 日,由美国商务部工业与安全局 (BIS) 发布的芯片和半导体设备出口限制新规(下文简称芯片出口限令)正式生效。

该新规由 BIS 在 10 月 17 日更新提出,旨在进一步限制中国购买高端计算芯片和涉及先进工艺的半导体设备。美国商务部长吉娜·雷蒙多 (Gina Raimondo) 直言不讳地表示,禁令的目的是限制中国「获得可能推动人工智能和高性能计算(AI 与 HPC)突破的先进半导体」。

11 月 17 日,英伟达 (NVIDIA) 中文官方网站已移除了 RTX 4090 显卡相关内容。

1.png

两次网页快照记录显示,GeForce RTX 40 系列显卡的介绍页面中已移除 4090 相关内容,原本用于展示的 RTX 4090 渲染图,也已被替换为 RTX 4080

这一变化是对美国商务部 10 月 17 日发布新规的直接响应,该规定严格限制了向中国出口高端 AI 芯片,包括英伟达的高性能 GPU 产品线——A100、H100、A800、H800、L40、L40S 以及备受瞩目的 4090。

此前 10 月中下旬,美国商务部曾在政策公示期间,直接立刻叫停 A800、H800 的对华出口。

02 戴尔销售文件流出:A40、A6000、4090 纷纷登上禁售清单

美对中芯片出口限令公布后,行业内的不确定性和紧张情绪一直持续高涨。11 月 17 日,这种紧张情绪似乎达到了顶点。

戴尔 (Dell) 公司销售文件中详细罗列了禁售国家、产品型号、指导建议等信息,在最终未能通过审查的英伟达 GPU 清单中,不仅包括了之前预期中的 A100、H100、A800、H800、L40S、L40 等型号显卡,还新增了 A30、A40、L4、RTX A6000,其中,备受关注的 RTX 4090 也在列。

国内消费者社区对 4090 是否在禁售名单之列的讨论,也迎来了确定的结果。

2.jpg

戴尔公司销售文件:详细罗列了禁售国家、产品型号、指导建议等

其他禁售产品还包括 AMD 和 Intel 的多款芯片。

其中,AMD 的受限产品涵盖了其服务器级 GPU,包括 MI210、MI250、MI250X 以及所有 MI300 系列产品,以及消费级显卡 RX7900 XTX、W7900 和 RX7900XT。

对于 Intel,限制涉及所有现有的 Gaudi 产品,以及所有 PVC & PCB 板/Max、Flex 系列产品。

英伟达受限 GPU 型号在计算核心和显存规模上的分布:

3.png

大语言模型 (Large Language Model, LLM) 在计算过程中需要较大的显存和较高的带宽速率,主流 LLM 推理框架如 vLLM、xinference 等对英伟达的支持通常到 sm75 甚至仅仅支持到 sm80。

禁令扩大至 A6000、A40 后,英伟达目前在产的所有高显存产品都受到了影响。计算性能受限固然严重,缺少显存体积的支持却更为致命,大型模型在芯片中的加载将受到显著影响。

此外,RTX 4090、A30 和 L4 等芯片虽然显存较小,但由于仅在 int8 单一指标上可以提供 300Tops 以上的计算能力,使得这些 GPU 型号也被纳入了限制名单,尽管它们原本未被预期为禁售目标。

主流模型参数在推理过程中需要的显存规模:

4.png

可以看到,如果无法获取受限规格芯片,300 亿以上参数规模的 LLMs 在推理运行过程中,将被迫使用更多的芯片运行,而跨卡互联会显著推高模型运行成本、降低推理效率,从而严重影响 LLM 在 AI 实际落地中的运用。

另外,消费级显卡如 4090,因其极高的性价比,实际被非常多的科研院所用于基础科研实践。

封锁高显存和任意计算指标 300Tflops (Tops) 以上的产品,这使得美商务部针对芯片禁令指标的下调意图非常明确,其实际目的有两个:限制中国人工智能行业对大语言模型的研发与规模化应用,同时遏制中国科研社区的 AI 研究基础。

03 英伟达的替代产品性能堪忧:难以满足 LLMs 推理需要

11 月 13 日,为了应对美国对中国实施的高性能 AI 芯片出口控制,英伟达公司确认将推出三款新型 AI 芯片——HGX H20、L20 PCIe 和 L2 PCIe,专为中国市场设计。这些新芯片的性能相较于公司的旗舰 H100 系列大幅降低,以符合美国的出口法规。

特别是 HGX H20 芯片,旨在满足 AI 模型训练需求,其带宽和计算速度都将受到限制,整体计算能力预计将比 H100 GPU 芯片低 80% 左右。这样的性能调整使得 HGX H20 的算力仅等同于 H100 的五分之一。

尽管这三款芯片均符合美国出口禁令的要求,但它们的性能仅与英伟达五到六年前的 Volta 和 Turing 架构相当,而这两代产品已经停产 2-3年以上。

5.png
英伟达将推出三款阉割版芯片以符合美对中芯片出口限令

尽管 Hopper 核心芯片内置了针对 Attention 架构的专用加速的单元,近似于 DSA 架构。但是阉割后的核心推理 LLMs 的速度仍将大幅降低,这将导致采购企业的成本大幅上升。

此外,美国商务部针对同为简配版本的 H800、A800 禁售策略变化珠玉在前,H20 对 LLMs 的优化如果保持优越的性能,恐怕又将列为禁令名单之列。

04 建立国产自主产业链势在必行

自 2021 年起,台积电等国际芯片制造商一直按要求向美国当局提交「资讯请求书 (Request for Information)」,这一请求书包括主要客户名单、库存和营收占比等关键信息。

2023 年 10 月,美国对华芯片制裁禁令对象继华为、寒武纪等厂商后,又新增了摩尔线程、璧仞科技。而其他在任意计算指标上超过 300Tflops 或 Tops 的国产芯片,尽管可能低于美国管制禁令中的计算指标,但仍然因影响到美国对华遏制的意图,从而进而受到干预。

6.png
受到禁令影响的芯片算力指标

在这种背景下,中国的芯⽚⾏业正⾯临着⼀个关键的转折点。

要在⼈⼯智能和先进科研领域保持竞争⼒并突破发展的瓶颈,中国必须加快建设⾃主可控的研发链路。这⼀过程不仅要求加强核⼼技术的研发,还需要在材料、设计、制造以及封装测试等各个环节实现⾃给⾃⾜,以确保科技进步不受外部因素的⼲扰。

尽管这⼀⽬标充满挑战,但对于中国来说,这是确保其⻓期科技安全和⾏业可持续发展的必由之路。

推荐阅读
关注数
664
内容数
163
链接人工智能新场景
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息