深卷积神经网络浪潮席卷人工智能领域。这些程序在某些方面能比人类做得更好,从面部和物体识别到玩古老的游戏--围棋等。
神经网络受到了由大脑结构的启发。机器视觉背后得深卷积神经网络的结构和大脑负责视觉得结构之间有着惊人的相似之处。其中的一个进化了数百万年,另一个是仅发展了短短几十年。但似乎都以同样的方式工作。
这引发了一个有趣的问题,如果机器视觉和人类视觉用类似的方式工作,他们是否也有同样的不足?人类和机器是否不能解决同样的视觉挑战?
首先是一些背景信息。在脑中负责视力的神经在有很多层,他们被认为从图像中提取逐步的详细信息,如运动,形状,颜色,等等。每一层是一个庞大的神经元网络。
深卷积神经网络具有类似的结构。他们也有层的结构,并且每个层由模仿大脑神经元的电路结构组成,神经网络的术语就是这么来的。
经过多次试验,计算机科学家们发现,这些神经网络层识别图像最好的时候,每个层逐步地提取更多信息。而且当他们看每个层的单独行为时,他们发现和大脑神经层有显著的相似性。
为了找到答案,Kheradpisheh 教授和他的合作人员用了四种物件的识别难度各异的图片,然后测试人类和深卷积神经网络的识别能力。
该团队让 89 个人每人识别 960 个图像。研究人员使用每个实验者反应的速度和准确性作为他们识别图片的测量。
该小组还在两个用于物体识别的最强大的深度卷积网络进行了等效试验,一个在加拿大多伦多大学开发,另一个在牛津大学开发。
结果是非常有趣的。 “我们发现,人类和深卷积神经网络很大程度上每一种变化的相对困难程度详细,” Kheradpisheh教授说 “3d旋转是迄今为止最难识别的,其次是放大缩小,然后在平面内旋转。”
这结果显示了使用卷积神经网络来帮助探测人类认知过程的可能性。这项技术或许可以在某些图像的设计中应用,如空中交通管制,紧急出口,使用救生设备等的指令等。