瑞芯微电子股份有限公司(以下简称“瑞芯微”)正式发布新一代机器视觉方案RV1106及RV1103,两颗芯片在NPU、ISP、视频编码、音频处理等性...
虽然self-attention最初是为自然语言处理(NLP)任务而设计的,但最近却席卷了各种计算机视觉领域。然而,图像的二维性质给在计算机视觉中...
2022北京冬奥会本是一届非凡的存在,这是有史以来第一次将奥运会所需的全部核心系统全面上云,以数字化技术创造奥运的新纪元。
奥运赛事每天都在上演冰雪奇迹,而捕捉发生瞬间,凝结最精彩、最动人的体育人文画面,让“冰之舞”、“雪之舞”、“速度之美”、“凌空之美”如...
检测小目标和远程目标检测是监控应用中的一个主要挑战。这些物体由图像中少量的像素表示,缺乏足够的细节,使得传统的检测器难以检测。...
避撞功能是智能车的最基本保护能力,Jetbot 使用深度学习的图像分类技术来模拟人眼习惯实现这个功能,但这只是智能车所展现的最入门应用...
据 Patently Apple 报道的一项专利,苹果正在研究一种新的光学音频传输技术,或将应用于传闻中的苹果 MR 眼镜。
注意力机制被广泛认为是Vision Transformer(ViT)成功的关键,因为它提供了一种灵活和强大的方法来建模空间关系。然而,注意力机制真的是...
如今,体育运动的热潮日益流行。同样,以不正确的方式进行运动的风险也在增加。有时可能会导致严重的伤害。考虑到这些原因,提出一种以...
北京冬奥会正在展开激烈的赛事角逐,与体育相关的话题持续刷屏,全民健身也蓬勃发展。那么大家是否想象过,当人工智能与体育相遇,会碰...
Transformers在许多视觉任务中都很成功,因为它们具有捕捉长期依赖性的能力。然而,它们的二次计算复杂度阻碍了将它们应用于需要密集预...
这篇文章对物体检测器的head进行深入的研究,提出了Double-Head-Ext 的方法,效果对比基线模型有明显的提升。
如果你是个哈利波特迷,你就会知道什么是隐形衣。是的!这是哈利波特用来隐身的隐形衣。当然,我们都知道隐形衣不是真的——它都是图形上...
文章来源 | 恒源云社区原文地址 | Flooding-X: 超参数无关的 Flooding 方法原文作者 | Mathor所谓大佬,就是只要你肯挖,总有你不知道的...
什么是计算机视觉?为什么值得我们花时间去了解?它是怎么工作的?什么样的应用程序有商业价值?今天我们就一起来看看这个问题吧。
首期直播,我们邀请到了肇观电子创始人兼CEO冯歆鹏先生,他就AI技术与真实场景三维重构等元宇宙重点话题与上百位业内人士深度分享,以下...
本文分析了小目标检测中使用IoU的最大缺点,对于位置的微小变化太过敏感,因此提出了一种新的度量包围框相似度的方法,用来替换IoU,从...
通常STR识别论文中的实验数据集来自真实街景图片,其中包含大量语义信息。那么在decode时利用attention机制的decoder往往可以很好地利用...
《安创“芯”视野》第35期,邀请到了Trifo创始人&CEO张哲博士,他从技术、场景和结构三个维度切入,为我们深入解析了扫地机器人未来的发展...
单图像超分辨率(SISR)是一项典型的计算机视觉任务,其目的是从低分辨率(LR)图像中重建高分辨率图像。SISR是智能手机和移动相机在现实应...