Jetson Nano 2GB 系列文章（21）： “Hello AI World” 图像分类指令

在前面的文章中，我们以“10 行 python 代码”为基础，深入地讲解了 Hello AI World 项目的输入（videoSource）、输出（videoOutput）以及参数解析的功能，就是为了让大家能更了解这个项目提供的工具是如此好用。

接下来我们回到 Hello AI World 的三大深度学习推理识别应用，Hello AI World 项目针对这三个应用，分别提供专门的函数库，协助使用者轻松调用。

本期将介绍“图像分类”这个应用的相关资源，包括项目已经编译好的相关工具，以及代码级别的函数调用方式，协助用户能更进一步地利用这些资源进行学习，并且开发出自己的应用代码。

当我们安装 jetson-inference 开源项目之后，系统已为我们的 Jetson 设备上安装好了“imagenet”这个执行指令以及“imagenet.py”这个可直接执行的 Python 代码。请开启一个终端，并且执行以下指令：

WeChat Image_20210522153814.jpg

由于系统预设的输入源是 CSI 摄像头，如果您的设备上已经装好 CSI 摄像头的话，就会正常启动摄像头的画面，如下图：

如果设备上没安装 CSI 摄像头，就会出现以下的错误信息：

假如您的设备上装有 USB 摄像头的话，可以执行以下指令，将输入源改成 USB 摄像头：

如果您的设备上没有任何摄像头的话，可以试试用视频文件或图像文件作为输入源。设备里面的/usr/share/visionworks/source/data 下面有些测试可用的视频，在~/jetson-inference/data/images 里面也有 100 多张图片，它们都可以妥善用来进行以下的测试：

好了，现在至少确认您已经有了能够作为测试的数据源。

图像分类简介

这是图像识别之后最入门的应用，深度学习之父 Geoffrey Hinton 为了让计算机能够识别最简单的“手写数字（如下图）”，几乎穷其一生的精力，开发堪称深度卷积神经网络（DCNN）鼻祖的 LeNet 神经网络算法。

后来经过他的爱徒 Alex Krizhevsky 改良的 AlexNet 神经网络，在 2013 年全球 LSVRC 图像识别竞赛中一举成名，才让深度神经网络的用途得到充分的验证，从此打开“深度学习”的康庄大道，在人工智能应用上得到了爆炸性的突破。而当时 AlexNet 的崛起，其实是高度依赖 NVIDIA GPU 的众核（ManyCores）架构，换言之，如果没有 NVIDIA GPU 的计算架构，如今深度学习可能还无法得到如此大的突破发展。

图像识别的应用，是以“图像”为单位去识别图像分类归属问题的。例如下图，每张图都属于一个分类，左边两种的特性还比较明显，最右边一张图里面虽然有“珊瑚”、“热带鱼”等，但是在归类过程就只归属于“珊瑚礁”类别。这是图像识别的基本原则。