吸取CNN优点!LeViT:快速推理的视觉Transformer,在速度/准确性的权衡方面LeViT明显优于现有的CNN和视觉Transformer,比如ViT、DeiT等,...
Monocular Real-time Full Body Capture with Inter-part Correlations
经过几个月不停地跳票,我们的人脸检测+关键点检测算法(libfacedetection@GitHub)第三版终于发布了!我们原计划春节假期发布,结果难...
【GiantPandaCV导语】本文对anchor-free类检测方案中的基于特征采样点的实现思路实现的RepPoint网络进行了解读。
首发:AIWalker作者:HappyAIWalker标题&作者团队paper: [链接]code: [链接]本文是清华大学&旷视科技在结构重参数领域继ACNet、RepVGG、...
作者提出了pixelNeRF,一个只需要输入单张或多张图像,就能得到连续场景表示的学习框架。由于现存的构建神经辐射场【1】的方法涉及到独...
首发:AIWalker作者:HappyAIWalker标题&作者团队paper: [链接]code:[链接]\_transformer (暂未开源)本文是谷歌大脑的研究员(原ViT团队)...
首发:AIWalker作者:HappyAIWalker标题&作者团队paper: [链接]code: [链接]本文是南洋理工大学Chen Change Loy团队在视频超分方面最新...
[GiantPandaCV导语]:模型剪枝算法核心在于找到“不重要”的参数并且实现裁剪。为寻找到较优的剪枝策略,我们往往需要尝试多种剪枝策略和...
首发:旷视研究院作者:R知乎:[链接]论文地址:[链接]论文代码:[链接]本文提出一种新的激活函数 ACON (activate or not),可以自适应...
我们知道,Tile 早在 2013 年就推出了第一款蓝牙追踪器,挂在行李、钥匙或包包上,可以帮忙用户寻找这些物品的位置。经过了八年发展,Ti...
首发:AI公园公众号 作者:Gidi Shperber编译:ronghuaiyang导读OCR中的研究,工具和挑战,都在这儿了。介绍我喜欢OCR(光学字符识别)。...
2018 年,印度国家转型委员会发布的报告中指出,印度地区法院、高级法院、最高法院中,堆积的未审结案件数量,已经超过了 2900 万。
首发:AI公园公众号 作者:Synced编译:ronghuaiyang导读不仅对CNN的backbone预训练,Transformer也要预训练,而且还是无监督的。论文地...
阿里云视频云的标准与实现团队与香港城市大学联合开发了基于 AI 生成的人脸视频压缩体系,相比于 VVC 标准,两者质量相当时可以取得 40%...
导读:本期为 AI 简报 20210416 期,将为您带来 7 条相关新闻~本文一共 2300 字,通篇阅读结束需要 5~8 分钟
网上有大量的YoloV5教程,本文的目的不是复制内容,而是对其进行扩展。我最近在做一个目标检测竞赛,虽然我发现了大量创建基线的教程,...
对中国很多区域城市而言,“要致富,先修路”这句过去经常能看见的标语,在今天仍然有着巨大的价值意义。但此时,这条“路”已经不再是有形...
在本文中,我将解释上一篇文章中称之为“2 class filter”的概念。这是一种用于目标检测和分类模型的综合技术,在过去几周我一直在做的Kag...
首发:AI公园公众号 作者:Mostafa Ibrahim编译:ronghuaiyang导读WBF已经成为优化目标检测的SOTA了。目标检测是计算机视觉中最常见、最...