1000和537哪个数字更大?
太简单了,连我家才上小学三年级的孩子都知道1000更大。
也正因为如此,最近某地在建1000P AI计算中心的事也就被媒体们捧上了热搜。据报道,该中心将提供1000PFLOPS算力,而考虑到如今“世界上最强的超级计算机算力约为235”,这个算力“相当于50万台电脑的算力之和”。另一家媒体的描述更为夸张——或许是嫌50万台电脑不过瘾,它将设备等效为了“5万台高性能计算机”。
从50万到5万,从普通电脑到高性能计算机,1000PFLOPS这个数字听起来颇为震撼。按照这些媒体的说法,似乎中国已经成为了超算世界第一,毕竟“5万台高性能计算机”的性能是非常恐怖的。每一年,国际都有TOP500超算排行榜,这其中汇集了世界排名前500名的超算系统。相比之下,一台设备就能具备5万台设备的性能,即便这5万台设备的性能再不济,积少成多都是非常恐怖的数字。
很显然,这其中一定是哪里出现了误会,媒体解读的1000PFLOPS究竟是确有其事还是张冠李戴?如今超算最强平台的性能是不是235P?这个1000P和235P的关系又如何?我们下面就一起来看看。
1、超算最强平台的性能是不是235P?
不是。
正如我们前面提到的,TOP500榜单是业界公认的、权威的超算系统排行,而根据2020年11月的最新一届榜单统计,当下全球排名第一的、运行速度最快的日本超级计算机富岳。这台超级计算机采用了700多万个核心,峰值性能达到了53.7亿亿次每秒,也就是537P FLOPS。媒体报道中提到的235P,大概只有它的一半多点,这个数字也不知道是从哪儿来的。
而1000P就是我们说的百亿亿次。要知道,为了实现这个目标,包括中国、美国在内的许多国家的顶尖科学家都在努力,但迄今为止还没有明确的消息公布。所以我们判断,这次AI计算中心所说的1000P显然具备另外的含义,它跟我们印象中的百亿亿次并不相同,媒体出现了明显的误读。
那么,这个1000P又是什么呢?
2、媒体口中的1000P并不是你以为的1000P
媒体口中的1000P并不是你以为的1000P。这句话听着有点乱,事实上媒体们口中的这个1000P并不是我们所说的超算意义上的1000P,甚至两者可以说是毫不相干的衡量标准。虽然看起来单位都是PFLOPS,但是代表的涵义却是差之千里。
刚刚我们提到了超算TOP500榜单。按照这个标准,入围的超级计算机都要进行一项名为LINPACK的测试,以考察平台的双精度浮点计算能力。也就是说,我们谈到TOP500榜单的时候,提到的任何成绩或者数值,都是基于双精度浮点程序的计算而获得的,比如富岳超算的537P FLOPS成绩。
但是媒体所说的“1000P”并不是这样。因为这个平台都是基于人工智能应用,而其运行的测试程序叫做Resnet-50,其成绩则是基于半精度浮点环境获得的。当然,这个Resnet-50也是行业通用的应用程序,同样具备权威性。但因为定位人工智能应用的原因,只考察平台的半精度能力,而不是双精度。
这下你就听明白了——TOP500基于双精度,Resnet-50基于半精度,这就好比体育比赛中不同竞技项目,根本就不可能同日而语。C罗和姚明谁更厉害?巅峰期的李娜能不能打过“大魔王”张怡宁?孙扬和郭晶晶谁的水性更好?这些问题恐怕真的没有答案。
当然不同精度的计算能力还是可以对比的,而且差距还不小。我们常听到半精度、单精度、双精度等词语,它们代表的是一种计算的精确范围。精度等级越高,获得的结果越趋近于真相。当然,使用怎样的精度计算完全取决于应用场景,比如人工智能训练要求不高,半精度已经足矣;而高性能计算大多与科研应用挂钩,自然是越精确越好。
介绍到这里,你就明白为什么“媒体报道的1000P并非是你理解的1000P”。也正因为不了解这其中的测试标准和评判准则,媒体们对1000P这个数字出现了误读,才有了“1000P大于537P”的结果,甚至出现了相当于“5万台高性能计算机”的结论。
假设错误,结论不可能正确,正如你在错误的道路上,走得越快,离真相就越远。
3、人工智能计算与高性能计算一样吗?
当然不是一回事儿,人工智能只是高性能计算的一个分支。
提起高性能计算这个名词,许多人并不陌生,一直以来它都是科研应用的基础,无论是大气物理、流体力学、生物工程、媒体影像……几乎所有的应用都可以通过高性能计算来实现,甚至在刘慈欣的小说《三体》中,三体人就是通过锁死人类的高性能计算机而阻碍了人类的发展。从这个角度来说,高性能计算是真正意义上的“高级计算”,超级计算机也是“国之重器”。
人工智能应用则走了另外的一条路。伴随着最近几年深度学习、机器学习、神经网络应用的崛起,人工智能深入了各行各业,也同样对于算力提出了很高的要求。但是它只是针对特定业务、特定场景产生的应用需求,难以覆盖整个行业。
换句话说,我们不能将人工智能等同于高性能计算来看待,人工智能无论从覆盖范围、应用场景还是算力表现都只是高性能计算的一小部分。如果把高性能计算比喻为大海,人工智能则更像是一条小河。虽然目前看来人工智能已经应用到了诸多领域,但是在解决问题的能力上,人工智能还很弱。
说到这里,你明白那个“1000P”是什么意思了吗?