E企研究院 · 9月8日 · 北京市

数字中国万里行 | 探访商汤临港AIDC:4910P峰值算力的智算中心长啥样?

“咦,恁大个楼,是弄啥嘞?”

转出刚才狭窄的小路,河南籍的出租车司机指着眼前突然出现的一栋宏伟高楼问我。

“是商场么?”

见我笑而不语,他不断追问道。

“那上面写着字呀,你看”

其实不需要我提醒,那巨大的字在几百米外都能看得很清楚。

“商场,我就说么,肯定是商场”

司机兴奋而坚定的说。

虽然这里还算是上海,但与大众心目中灯红酒绿的外滩不同,这个位于上海东南角、距离迪士尼都还要50公里的地方,能出现这么大一个“商场”的确让人兴奋。而司机师傅更骄傲的,是他的“判断力”。

“哪有商场不写名字品牌,却把这两个字挂在墙上的”

我实在忍不住了,出言调侃他。

“你说的也对哈”

司机似乎有所领悟,随后却又疑惑起来——的确这两个字如果是“商场”来说太奇怪了,但不是商场又能是什么呢?

眼看着大楼越来越近,这位年过半百的司机大叔猛然反应过来。

“不是商场,是商汤”。

随后他缓缓转过了头,一字一顿的问我:

商汤是什么?
640 (1).jpeg

正所谓术业有专攻,与司机大叔不同,相信IT从业者们都听说过商汤的大名。这家总部位于上海的公司一直专注于人工智能技术与应用的开发,也是全球领先的人工智能软件公司。随着2022年度数字中国万里行活动的开启,我们将为大家带来包括长三角、京津冀、大湾区、成渝等多地数字化发展的探寻之旅。而这次华东站的第一场活动,我们就选择了位于上海临港新片区的商汤人工智能计算中心。之所以选择这里开启第一站的旅程,就是因为商汤人工智能计算中心的独特魅力——其设计算力高达4910 Petaflops,比业界宣传的主流标准高出了一个数量级。

那么,这么大规模的AI智算中心是如何打造的?相对于行业内普遍的200P-300P算力,商汤为什么要打造超过一个数量级的智算中心?这家智算中心内部的设计与架构又是怎样的呢?下面就请大家跟随数字中国万里行团队的脚步,我们一起进去看看。

打造上海人工智能“新基建”标杆工程

640.png
长三角地区,涵盖上海、江苏、浙江、安徽三省一市,是我国经济最活跃、开放程度最高、创新能力最强的区域之一。而对于上海来说,中国(上海)自由贸易试验区临港新片区(以下简称“临港”)更是一个独特的存在,凭借着专项鼓励政策、丰厚产业资金支持、针对性的人才引进政策和强有力的科研开发奖励,成立仅三年的临港新片区就已经汇聚了包括中国移动、中国联通、中国电信、有孚大数据、信息飞鱼、城地香江等众多科技企业。而商汤科技人工智能计算中心入驻,为临港地区增添了更强大的AI算力,也将赋能整个长三角地区乃至于辐射至全国。
640 (1).png
在刚刚结束的2022世界人工智能大会上,商汤科技宣布推出SenseCore商汤大装置AI云,为开发者、企业客户提供一个高效的、低成本的一站式的AI开发环境。而这朵云正是运行在临港智算中心(AIDC)上。按照规划,商汤AIDC设计13万平方米、项目总投资约56亿元、一期机柜数量5000个。当AIDC投入使用后,商汤总算力将超过4910 Petaflops(1 Petaflops为每秒千万亿次浮点运算),将继续引领中国AI智算与产业发展。

这么一栋宏伟的的建筑建成需要多久?恐怕没人能猜到正确答案。从2020年7月7日奠基,到9天后桩基开工,再到12月31日主体结构封顶仪式,整个过程只用了168天,创下新纪录,彰显上海服务、临港速度。168天,即便是在号称“基建狂魔”的中国,这个速度也让人咋舌,而之所以能达到这样的效率,上海市经济和信息化委员会副主任张英也给出了答案——“商汤AIDC项目,不仅是上海版‘新基建’行动方案中重要任务,也是落实人工智能‘上海方案’的重要举措。希望商汤科技作为头部企业促进产业链协同发展,持续推动人工智能的应用赋能,力争将本项目打造为上海人工智能‘新基建’标杆。”
640 (2).jpeg
据介绍,AIDC的设计灵感来源于商汤从自身业务沉淀出来的经验——特定的行业例如智慧城市、智能汽车、元宇宙等需要大模型大算力,而这些AI的应用场景需要特定的芯片才催生出来了AIDC。

虽然目前AIDC只完成了一期工程,但是从我们航拍的鸟瞰图来看,整个AIDC园区已经呈现出芯片的样式,相互连通的办公楼与机房正如芯片上不同的模块,而这里也将成为华东地区AI算力的“发动机”。现场,商汤AI大装置产业赋能中心主任蒋钦也饶有兴致的介绍起AIDC开工过程中的“临港速度”——管委会全面优化工程建设审批流程,使得我们在同一天上午就拿到规划许可证,下午就把施工许可证“两证”都拿到了,所以我们才能很快就能开工,进度也非常快。就这样在多方的高效沟通与协作下,商汤AIDC创造了智算中心建设的新记录,也为上海乃至长三角带来了丰富的AI算力。

从基础设施到应用场景,商汤AI大装置实现全连接

众所周知,人工智能发展的三大要素就是算力、算法和数据,这其中算力作为核心动力,是人工智能发展的引擎。刚刚我们提到的商汤AI大装置云服务,就是基于临港智算中心打造的商汤AI大装置,也就是兼顾了软硬一体的超大型通用AI基础设施。通过将计算基础设施、深度学习平台、模型层三个部分有机整合,商汤AI大装置实现了批量的算法模型生产、部署和迭代升级,以更高效率更低成本进一步带动AI产能的创新升级。
640 (3).jpeg
商汤AI大装置产业赋能中心主任蒋钦正在进行介绍

这其中核心的价值就在于场景化。从芯片到算力,这其中并不是一个直接的转化过程,而需要场景化的推动,需要针对千行百业的场景提供针对性的算法和数据分析,才能最终指导实践。这其中,商汤所扮演的就是桥梁的作用,AIDC本身就是通过强大的算力和多场景、多维度的算法,将底层技术设计与上层应用连接在一起形成闭环。就像商汤科技联合创始人、AI大装置事业群总裁杨帆提到的:“国内的现状是专注应用场景的算法厂商较少涉足芯片领域,而芯片厂商反过来又很难接触到行业一线的反馈,没有形成一个迭代的良性闭环,但这恰恰是AI生态建立的必由之路。”

商汤就致力于帮助用户乃至于产业链打造这样的能力,所以研发的AI大装置也从计算基础设施、深度学习平台、模型层三个层面进行了针对性的能力覆盖。其中,计算基础设施采用了海量AI芯片及AI传感器,能够提供强大的算力基础,其设计算力高达4910 Petaflops。要知道,目前业界绝大多数智算中心的算力都在200-300 Petaflops之间,相比之下商汤实现了行业十倍的提升,自然也会为用户带来跨越式的体验。真正实现了——AI一日,世上万年。
640 (4).jpeg
这里还需要提到的就是,在商汤的展厅中,我们还看到了国产化算力的展示内容,其中包括华为、澜起、燧原、壁仞等众多大家熟悉的国产芯片,也体现了商汤广泛的生态兼容性。其实早在去年,商汤宣布与清华大学、复旦大学、上海交通大学、中国信息通信研究院、中国电子技术标准化研究院及行业伙伴成立“人工智能算力产业生态联盟”(智算联盟)。如今该联盟不断发展壮大,囊括多家AI芯片、AI软件、AI应用场景等头部企事业单位。

有了强大的算力,还需要深度学习的算法支撑。为了打通数据平台、深度学习训练框架、深度学习推理部署引擎和模型生产平台,商汤打造了全新的通用算法开发平台,实现从数据存储、标注到模型训练、生产、部署、测试的全链路、批量化过程。其中,面向工业级应用的SenseParrots是国内最早自主研发的深度学习框架之一。凭借对内存存储、通信及同步的高度优化,SenseParrots可将训练任务扩展至数千个GPU,在1,024个GPU上实现了91.5%的高并行效率,训练吞吐量可达2,000,000Pics/Sec,在ImageNet数据集上仅需55秒即可完成分类模型千卡训练。
640 (5).jpeg
商汤努力的最后一个环节就是基于深度学习平台生产的创新算法模型。相对于上面强大的算法来说,模型层应用更多实现的是“授人以渔”的效果,就是面向企业开发者提供算法工具,为企业赋能,助力其实现智能化升级。这样的好处在于,一方面企业用户可以根据自身的场景对于模型框架进行微调,更贴合业务应用;另一方面也帮助商汤扩大了模型的覆盖率,壮大了生态,也吸引更多人投身其中。如今,模型层已具备超过49000 个商用人工智能模型;同时通过与香港中文大学商汤联合实验室(MMLab)打造算法开源计划(OpenMMLab),商汤正与广大社区开发者共同构建创新生态。
640 (6).jpeg
图中下方的白色建筑为柴发备用供电,右上角灰色建筑为园区自建220KV变电站

如此,商汤就实现了AI应用从底层架构到算法与模型的覆盖,更能够为用户提供多元化、多场景的选择和解决方案。除此之外,别看AIDC的规模很大,但是其实商汤在设计之初就考虑到了低碳节能的问题,毕竟这么多设备放在一起,每节省1%的能耗都会是巨大的数字。为此商汤也为上海临港AIDC采取了各种能源优化措施,包括光伏发电、高效变频离心机、UPS Eco模式、LED照明及湿膜加湿。同时,还实施了离心系统,并部署工业冷却制冷剂,预期将令商汤的冷却效率每摄氏度提高了3-5% ,从而将能耗降低80%。商汤还在AIDC内实施节能功耗系统,预期将令线损率降低约50%。

多场景覆盖,商汤打造“一平台和四支柱”

场景落地不仅是客户业务的需求,也是商汤技术的价值实现。目前,商汤的业务基本可以概括为“一平台,四支柱”。“一平台”自然就是我们介绍的SenseCore商汤AI大装置平台,这是商汤所有技术实现的“底座”,而在这个底座之上商汤还打造了“四支柱”即四大业务板块,分别是智慧商业、智慧城市、智慧生活和智能汽车。这其中,智能汽车是当下最热门的应用,同时还可以与智慧商业、智慧城市以及智慧生活等多种场景结合,实现商业的多元化。而在这次参观过程中,我们也在园区中看到了商汤绝影打造的L4级自动驾驶小巴。
640 (7).jpeg
在WAIC 2022上,商汤发布了SenseAuto V2X商汤绝影车路协同平台。这个平台的设计理念就是“聪明的车+智慧的路+协同的云”一体化分析决策方案,对车端、路端信息融合处理、分析,实现“车-路-云”一体化决策控制,为交通参与者提供更精准的感知信息,全面提升出行的安全与效率。比如我们看到的这辆绝影小巴就属于网联化改造的传统车辆,具备了L4级自动驾驶能力。除此之外商汤还将在路平台提供感知能力与较智能的信号灯控制系统,在与平台实现车端接入、路侧设备接入和云端控制等能力,实现真正意义上的车路协同。目前商汤绝影车路协同产品体系已经接入120多万台网联运营车辆,同时具备20多项智慧交通的检测能力。

为了进一步提升自身科研与服务能力,商汤也开启了与众多科研院所和高校的合作。除了上面我们介绍的人工智能算力产业生态联盟,商汤还与国家蛋白质科学中心(上海)等科研机构及高校达成合作意向,充分利用人工智能技术,带动传统科学研究进入新的发展模式,从时间维度上加速生物学等领域的重点科技项目的攻关,从空间维度上推动更多跨学科领域的交叉融合,从可能性维度上实现大规模、复杂体系多尺度模型等高难度课题的突破,将以往传统科学手段认为的不可能变成今天的可能。

作为2022数字中国万里行的第一站,商汤临港智算中心表现出了强大的算力服务能力,也提供了迎合当下智能化、数字化发展需求的多场景应用展示,彰显了商汤在智算领域的领先地位。对于数字中国万里行来说,今年我们在突出算力优势的同时,也特别看中低碳节能与东数西算的协同应用,而本次商汤临港智算中心在节能方面给我们带来了不少惊喜,尤其是对于智算中心的行业应用来说也起到了很好的示范作用。
640 (2).png
正如参与本次考察的行业专家、上海交通大学网络信息中心副主任林新华老师所说:“商汤提供的算力基础设施非常先进,也符合国家东数西算的发展战略和业界对于AI计算的需求,体现了中国乃至全球层面的高端水准”。

推荐阅读
关注数
4952
内容数
291
E企实验室由E企研究院专职产品技术分析师针对数据中心、云计算、AI和5G等领域最新技术和应用研究、验证、试用、分析,数据中心级新产品新技术的市场教育,国内唯一同时研究互联网和传统企业IT基础设施的机构和部门
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息