Title: Centralized Feature Pyramid for Object Detection Paper: [链接] Code: [链接]
Title: Track Anything: Segment Anything Meets Videos Paper: [链接] Code: [链接]
在资源受限的无人机平台上,低延迟无人机图像的目标检测是一项重要但具有挑战性的任务。本文研究了基于稀疏卷积的检测头优化,证明了其...
近日,微帧科技正式宣布了与VerSe Innovation的合作,基于微帧视频智能编码引擎,为VerSe Innovation旗下的短视频平台Josh提供卓越的视...
Title:DINOv2: Learning Robust Visual Features without Supervision Paper:[链接] Code:[链接]
小目标检测是计算机视觉和目标检测领域的一个重大挑战。小目标检测器的性能往往因缺乏像素和不太重要的特征而受到影响。这个问题源于特...
最近,基于Transformer的端到端检测器(DETR)已经取得了显著的性能。然而,DETR的高计算成本问题尚未得到有效解决,这限制了它们的实际...
Title: SegGPT: Segmenting Everything In Context Paper: [链接] Code: [链接]
知识蒸馏(KD)是深度神经网络中一种众所周知的训练范式,其中由教师模型获得的知识传递给一个学生模型。KD已被证明是一种有效的技术,...
大语言模型LLM是这几个月热度最高的全球明星。目前看来,AI逐渐走向复杂专业的白领型岗位,已经是必然的趋势。
Title: ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every Detection Box Paper: [链接] Code: [链接]
在资源受限的无人机平台上,低延迟无人机图像的目标检测是一项重要但具有挑战性的任务。本文研究了基于稀疏卷积的检测头优化,证明了其...
Title: SNet: Multi-scale in Multi-scale Subtraction Network for Medical Image Segmentation Paper: [链接] Code: [链接]
最近对实例分割的关注集中在基于查询的模型上。尽管这些模型是无非最大值抑制(NMS)和端到端的,但在高精度实时基准测试上的优势尚未得...
Title: A FEW-SHOT ATTENTION RECURRENT RESIDUAL U-NET FOR CRACK SEGMENTATIONPaper: [链接]Code: [链接]
Active Learning主动学习是机器学习 (ML) 的一个研究领域,旨在通过以智能方式查询管道的下一个数据来降低构建新机器学习解决方案的成本...
近日,CVPR 2023 论文接收结果出炉。近年来,CVPR 的投稿数量持续增加,今年收到有效投稿 9155 篇,和 CVPR 2022 相比增加 12%,创历史...
内容一览:北京时间 3 月 21 日 23:00,英伟达创始人兼 CEO 黄仁勋在 GTC 2023 上发表主题演讲,介绍了生成式 AI、元宇宙、大语言模型、...
去年我们发过一篇文章《综合多项指标评价视频质量,才能更接近主观感受》,指出了不同客观评价指标的“喜”与“忧”,并表示“在日常评价视频...
近年来对二维姿态估计的研究在公共基准上已经取得了不错的进展,但其在工业界的应用仍存在着模型参数大和高延迟的问题。为了弥补这一差...