旷视研究院 · 2021年07月29日

赛场上的 AI 务实派:经典招式,也能作出“新解”!

参赛结果超出了预期,更重要的是也意识到了自己的不足,可以让我们更好地进步。

——旺仔QQ糖

在比赛中得到了很好的锻炼,也达到了预期目标,还算成功。

—— Fishtrack

对于第一届中国农业人工智能创新创业大赛的亚军、季军队伍来说,一个月的比赛时间,他们收获的不仅是荣誉,还有更多的成长。

旺仔QQ糖:用“旧”方法,解决“新”问题

团队档案

旺仔QQ糖

第一届中国农业人工智能创新创业大赛亚军  

队员:

龚文超 广东海洋大学研二 深圳职业技术学院联合培养

杨晓帆 深圳职业技术学院助理研究员 华南农业大学研究生

 

分析一条鱼的行为或许在很多人眼中有点莫名其妙,但对于旺仔QQ糖的成员们来说,却是向新领域探索的一次成功尝试。

作为主修方向为畜牧与农业的学生,他们总是带上了点脚踏实地的精神。虽然研究方向与渔业并不是很相关,但在导师告知比赛信息时,他们还是义无反顾地接受了从“人工智能养猪”到“人工智能养鱼”的“亿点”变化。

“旷视在高校里挺有号召力的,我们导师看到比赛的消息后鼓励我们参加,那我们也想借这个机会努力尝试一次。”

这次大赛的赛题是“基于深度学习的鱼类多目标跟踪”,针对鱼类的活动数据训练、构建深度学习模型,提高跟踪精准度。

因为在畜牧业行为识别、果园精准管理关键技术研究方面有着丰富的经验,所以旺仔QQ糖在看到赛题要求时并没有无从下手的陌生感。“去年年底就做过幼猪的多目标跟踪,我们到老乡家里去租了一些猪,然后在猪圈里检测数据,”谈到此前的项目经验也令龚文超十分难忘。而在经过“猪圈”的磨练后,面对“鱼塘”,龚文超也有了更多底气。

image.png

图:旺仔QQ糖(左二龚文超,左三杨晓帆)

事实上,与大部分算法工程师先学习 AI 再深入学习行业不同,团队主要负责人龚文超是从研二才开始进行人工智能学习的,但畜牧业出身给了他直击行业痛点的“超能力”,这也让他们团队在选择跟踪方法时更加轻车熟路:“之前在猪身上做过实验,需要特征信息的网络会出现不稳定的情况,比如两个目标靠得太近,就会导致两个目标的 ID 来回转换,变化次数增加。所以我们采用了传统的 IOU Tracker 方法,根据两个检测框重叠面积、重叠程度来计算是否是同一个目标。这在 MegEngine 框架下很容易掌握,而且不用更换设备,比较省钱省心。”龚文超说。

640.gif

旺仔QQ糖采用 IOU Tracker 方法实现多目标跟踪

比赛成绩是这一方法可行的最佳证明:旺仔QQ糖以 0.64076 的综合得分位居第二,其中 0.5888 的评测得分是所有团队中最高的。

“会有小小的遗憾,我对这个领域的了解还不够全面,临场发挥表现和逻辑等方面还有不足。”龚文超赛后反思,比赛不仅让他了解到自己的短板,也让他收获了更多,“一直想学 MegEngine 项目创作是如何用的,但一直苦于无人指导,现在通过比赛,我学会了如何使用算力、搭建网络,对我的帮助很大;而且 MegEngine 上有提供算力,比我电脑跑起来速度快了好几倍。”

Fishtrack:“拦路虎”很多,迎战对策也很多

团队档案

第一届中国农业人工智能创新创业大赛季军  


队员:

梁超 电子科技大学研究生在读

鲁豪杰 电子科技大学研究生在读

杨亚楼 电子科技大学研究生在读

张志鹏 中科院自动化研究所博士在读

丁金 电子科技大学研究生在读

得知比赛消息后,来自电子科技大学同一教研室的梁超、鲁豪杰、杨亚楼、丁金四位同学和师兄张志鹏组建了 Fishtrack ,“我们用的是比较传统的两阶段法—— tracking-by-detection 的方法,就是先做检测,然后再做跟踪。”

image.png

图:Fishtrack 采用 tracking-by-detection 方法实现多目标跟踪

用这一方法取得 0.623019 的综合得分,Fishtrack 登上了季军宝座,不过在团队眼中,这并不是最优解,“一开始想用 one-shot ,但我们很多代码都是基于 PyTorch 编写的,赛程只有半个月,没有成功地把代码转到 MegEngine ,最后用了比较好做复现的方法。”

总结问题根源所在,Fishtrack 觉得是因为不熟悉框架,“这是我们第一次比较深入地接触国产开源框架,MegEngine 和 PyTorch 都是基于 Python 去做编程,使用过程比较相像。但因为我们不够熟悉,因此从 PyTorch 转到 MegEngine 时出现了 Bug,还好这对我们来说不是大问题。”

随着越来越熟悉 MegEngine 后,大家很快被它迷住, 且 MegStudio 平台提供的算力和框架也让他们不用更换装备,就能完成项目。“我们会考虑基于 MegEngine 完成更多任务,毕竟对硬件设备相对会更友好一点。”梁超说到。

不熟悉框架并非 Fishtrack 遇到的唯一一只“拦路虎”,团队这次比赛满是波折。虽然与旺仔QQ糖一样,Fishtrack 也有着目标追踪的项目经验,但 “追鱼”还是有很大的差别:“鱼的姿态很相似,外观更难区分,怎么区分不同的鱼花了不少时间解决。”

虽然比赛过程中遇到了很多挫折,但他们最终还是成功找到了解决办法,也收获了更多,“比赛帮助我们提高了一些代码能力,感受参赛的氛围,积累参赛的经验。”

#后记

在赛场上各显神通的队伍,赛后的愿望却出奇朴实——那就是吃。
旺仔QQ糖又去买了一包QQ糖,而 Fishtrack 则期待着能用奖金大吃一顿。
或许,边吃边“追踪”一下饭店水族箱的鱼也别有一番乐趣!
首发:旷视研究院
作者:旷视研究院

专栏文章推荐

欢迎关注旷视研究院极术社区专栏,定期更新最新旷视研究院成果
加入旷视:career@megvii.com
推荐阅读
关注数
7710
内容数
164
专注旷视研究院学术论文解读推送,涵盖计算机视觉,文字识别等
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息