该文是亚利桑那州立大学&微软联合提出的一种自监督蒸馏表达学习方案,已被ICLR2021接收为Poster。针对现有对比自监督学习方案在小模型上...
数据是人工智能时代的石油,但是由于监管法规和商业机密等因素限制,"数据孤岛"现象越来越明显。联邦学习(Federated Learning)是一种...
paper: httsp://arxiv.org/abs/2101.03697 code: [链接] 注:公众号后台回复:RepVGG,即可下载上述论文&code&预训练模型。
一篇关于度量学习损失函数的综述,这是第一部分,对比损失和三元组损失。检索网络对于搜索和索引是必不可少的。深度学习利用各种排名损...
2016 年,深度学习和深度神经网络的突破使得智能语音识别的准确率第一次达到了人类水平,也促使智能语音技术进入到落地阶段。尤其是近几...
在训练深度学习模型时,一个非常重要的超参数就是学习率,学习率设置的合理与否,非常影响模型的收敛速度和最终性能。本篇文章为大家总...
[导读] 在知乎上看到一个问题,傅里叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?我觉得这是一个非常好的问题,貌...
该文是旷视科技&快手&电子科技联合提出的一种图像降噪方案,该方案从一种新的角度(子空间投影)对图像降噪问题进行了分析并提出了一种新...
首发:AI公园公众号编译:ronghuaiyang导读只说重要的,计算量基本不变,涨AP,3.5个点!论文:[链接]代码:[链接]在做目标检测的时候,...
本周(12月6日至12日)国际人工智能顶级会议NeurIPS 2020(Conference on Neural Information Processing Systems, 神经信息处理系统大会)...
导读又一篇anchor匹配策略的文章,不过确实是简单有效,在ATSS上只需要很小的修改就可以提升性能。GFL2在框的预测上用上了概率分布,这...
该文是中科大陈志波老师团队在RealSR方面的一个工作,它从频率角度出发分析了RealSR与SISR之间的关键差异,基于差异所在设计了一种频率...
在近期举办的Openl/O 2020启智开发者大会期间,旷视集结明星讲师天团,为现场及线上开发者带来了干货满满的“天元精品课程”,分享我们在...
2020 年是不平凡的一年,突如其来的疫情,虽然改变了人们的生活方式,但却为人工智能的发展按下了加速键,语音的「非接触」交互优势被充...
基于IoU的NMS实际上是一种贪心算法,这种方法得到的结果往往不是最优的,Confluence给出了另一种选择。
将分类损失引入到正样本的匹配过程中,每个gt只匹配一个正样本,简单的两个改动,消除了冗余的预测框,去掉了NMS。
我们刚开始拿到的图片集是xxx1.jpg xxx2.jpg 。。。堆集在一个目录的图片,其中1表示左摄像头,2表示右摄像头。
今天我们将讨论一个新的方法称为Sparse R-CNN(不要和处理3D计算机视觉任务的Sparse R-CNN混淆),使用了完全稀疏和可学习的包围框生成来...
2005年,谢映莲完成卡内基梅隆计算机专业的博士学位,开始纠结于未来选择。卡内基梅隆位于美国匹兹堡,是计算机工业最初的推动者之一,...
为了便于分析人类的行为、互动和情绪,本文从单目图像中计算出人体姿态、手姿态和面部表情的三维模型。为了实现这一点,本文使用数千个3...