给定应用场景,设计CNN的过程往往需要花费大量的人力与物力。架构中立的CNN结构可以无缝对接插入到现有网络中并提升性能,如𝑂𝐶𝑇𝐶𝑜𝑛𝑣,𝑆𝐸...
不确定性估计的发展已经有很长的历史,但是到最近才开始被基于深度学习的计算机视觉工作所应用,因此是一个很新的领域。本文为旷视危夷...
我们身处的环境本身多模态环境,人工智能要更好的理解环境,则需要具备解析多模态信息的能力。通过模态学习可以搭建能处理和连接多模态...
本篇文章汇总了17篇6D姿态估计的算法,包括论文,开源代码及解读,欢迎关注。作者: Tom Hardy首发:3D视觉工坊微信公众号
旷视研究院提出一个轻量级的两阶段目标检测器,称之为 ThunderNet,其设计针对的是当前最优的两阶段检测器中的最耗计算量的结构。相较于...
KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。该...
物体检测器通常使用图像分类网络的Backbone,由于和检测任务存在一定差异,这些Backbone往往不是最优的。本文中,旷视研究院提出DetNAS...
本文围绕着“密集场景人体检测”这一问题而展开,介绍了CrowdHuman数据集,并讨论了适用于密集场景,并可以实现人-头绑定的检测技术Double...