Jetson Nano 2GB 系列文章（24）:“Hello AI World”的物件识别应用

本系列最后一个需要说明的推理识别应用，就是语义分割（semantic segmentation）的推理识别，字面上经常造成初学者的误解，以为这是语音语义识别相关的应用。现在我们看看下面的一张图片，就比较能理解语义分割的应用是什么。

在这张图中，可以看到每种“类别”是用“颜色”做区隔，并且每个物件已不再是“矩形框”的标注方式，而是完全将物件的原本形状都标示出来，如此就能更进一步地用计算机视觉的方式，将“全场景”与“物件”之间，形成信息量更完整的“语义”表述。

这类的应用场景，大部分都是“专业”用途，例如医学成像、肿瘤分析、航拍识别、无人驾驶、城市规划之类，对“精确度”要求更高的应用，属于“像素级”的推理识别，其难度与计算量，比前面的图像分类、物件检测要高出许多，对初学者来说，只要简单体验一下就可以。

Hello AI World 项目为语义分割应用，也同样提供 segnet 指令与 segnet.py 代码，二者的使用方式与功能是相同的，指令的主要参数列表条列如下，其中黄色标出的部分是比较重要的参数：

--network 参数应该是很熟悉了，项目也为这个应用提供 11 个预训练模型可轻松调用（如下表）：

系统预设的网络模型是
FCN-ResNet18-Pascal-VOC-320x320（Pascal VOC 320x320），这是个比较通用类的模型。

前面提过，语义分割的推理识别，最终以“颜色”来进行分类的显示，而每种模型的分类与对应颜色都不一样，所以必须有这样的对照表去比对。在 ~/jetson-inference/data/networks 下面有多个 “FCN-” 带头的子目录，下面放的都是 segnet 使用的预训练模型文件，以及 “classes.txt” 与 “colors.txt” 这两个类别与颜色的对应表，请自行参考内容。

不同模型的针对性都不同，例如系统预设的 Pascal VOC 模型属于比较通用的，其类别与颜色对照表如下：

现在以 ~/jetson-inference/data/images/peds_0.jpg （如下图）为对象，来进行不同模型的测试结果。

执行以下指令：

执行结果如下图：

这边识别出“四个人”并且用对应的颜色显示出来。左边的图就是前面说到 “--visualize=overlay” 时的表示方法，将颜色与原图进行“重叠（overlay）”显示；右边部分是 “--visulaize=mask” 的显示结果，只显示检测到的部分，未检测到的地方则全部“遮盖（mask）”掉。

如果将网络模型改成 Cityscape 的话，看看会呈现怎样的结果？