首发:AI公园公众号作者:Rohan Jagtap 编译:ronghuaiyang导读掌握这些可以更高效的模型的提高开发效率。TensorFlow 2.x在构建模型和Te...
该论文利用了城市场景图像的内在特征,并提出了一个通用的附加模块,称为高度驱动的注意力网络(HANet),用于改善城市场景图像的语义分...
人类具有一双眼睛,对同一目标可以形成视差,因而能清晰地感知到三维世界。因此,计算机的一双眼睛通常用双目视觉来实现,双目视觉就是...
市场调研机构 Strategy Analytics 两年前的预测曾指出,到 2023 年,语音助手渗透率将达到 90%。而在各大手机厂商的推动下,手机语音助...
这篇文章来自商汤科技,是OpenImage竞赛的冠军方案,本文对物体检测中的分类和回归任务的冲突问题进行了重新的审视,并给出了一个为不同...
这是众多Anchor Free中比较有影响力的一篇文章,不光是效果好,而且思路清楚,简单,不需要任何trick,并将众多的视觉任务统一到了一个...
WACV2021的一篇文章,将CenterNet的方案用到了旋转物体的检测中,设计了一种精巧的旋转框表达方式,免去了设计anchor麻烦,效果也非常好...
近期,基于 TensorFlow 的隐私 AI 框架 Rosetta 正式开源([链接])。借助 Rosetta,AI 开发者不需要了解密码学等隐私保护技术,只需要...
【Happy导语】该文是北邮&南开大学联合提出了一种“即插即用”计算单元,它基于特征冗余而设计,它将输入特征分成两组分别进行处理最后采...
云栖大会云上 Hello World 活动火热进行中!每位参与者都可收获一份阿里云出品的全球唯一序列号纪念证书!
“15分钟看顶会”是旷视研究院全新推出的论文快速解读专栏,聚焦旷视在全球各大顶会、期刊等平台所发表的工作,覆盖深度学习、计算机视觉...
虽然目前多智能体强化学习 MARL 在很多领域取得了不错的结果,但很少有相关的理论分析。本综述挑选并汇总了拥有理论支撑的 MARL 算法,...
AI开发频遇芯片性能瓶颈?算法门槛高,模型部署费力不讨好?策略开发流程复杂,应用难落地?**9月12日 晚21点15分地平线抖音直播间AI大...
_深度学习是一个了不起的方法,用于遥感数据集,如卫星或航空照片的目标检测和分割/匹配。然而,就像深度学习的许多其应用场景一样,获...
这篇文章的作者是华为加拿大诺亚方舟实验室,是一篇将双向注意力机制用于弹幕深度估计的工作。主要的创新点在视觉注意力机制的基础上引...
对使用PyTorch Lightning的训练代码和原始的PyTorch代码进行了对比,展示了其简单,干净,灵活的优点,相信你会喜欢的。
【Happy导语】该文是旷视科技的研究员提出的一种“商用端侧RAW图像降噪”方法,相应方法已被广泛应用到OPPO、小米等手机中。从笔者角度来...
最近,PyTorch推出了名为torchserve.的新生产框架来为模型提供服务。我们看一下今天的roadmap:
【导语】图像/视频增强在手机端的应用非常多,但是基于深度学习的画质增强方法却往往难以真正的落地,这其中原因有二:(1) 模型过大,导...
文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。