Sparse R-CNN是最近的一种强目标检测Baseline,通过对稀疏的、可学习的proposal boxes和proposal features进行集合预测。在这项工作中提...
随着信息技术的发展,人们对实时通信的需求不断增加,并逐渐成为工作生活中不可或缺的一部分。每年海量的音视频通话分钟数对互联网基础...
在 4 月 29 日的 Snap 合作伙伴大会上,Snap CEO Spiegel 展示了一款通体黄色、内置四旋翼的消费级无人机——Pixy。
【GiantPandaCV 导语】最近因为工程需要,就去调研一下 open-set detection 算法,然后发现一篇不错的论文 《Towards Open-Set Object D...
近年来流行的毫米波雷达越来越多地被利用到了智能家居领域,通过动作识别和空间占用检测,实现行动方向检测、距离变化检测、室内空间定...
文章来源 | 恒源云社区原文地址 | VSA原文作者 | 咚咚伙伴们,好久不见了啊。最近平台各种功能上线,实在抽不出时间搬运大佬们的文章,...
瑞芯微技术研发培训视频上线啦!26个干货课程,热门产品悉数覆盖!先报名再观看噢! 报名链接:[链接] 课程观看平台:[链接] 详细课程主...
CVPR(IEEE Conference on Computer Vision and Pattern Recognition)作为计算机视觉和模式识别领域的顶级会议,在全球具有极高的权威...
目标检测有2种主流:top-down和bottom-up。最先进的方法大多属于第一类。在本文中,作者证明了bottom-up方法与top-down的方法具有同样的...
图像分类 (image classification) 是视觉人工智能的最基础应用,目前 TAO 模型训练工具支持 resnet、vgg、mobilenet_v1、mobilenet_v2、...
随着技术的发展和超视频化的时代驱动,交互的形式日渐丰富。从屏幕点触,到语音交互,人脸、指纹、声纹,再到近年流行的AR和VR……人类早...
本文介绍了YOLO-Pose,一种新的无Heatmap联合检测方法,是基于YOLOv5目标检测框架的姿态估计。现有的基于Heatmap的两阶段方法并不是最优...
凭借在人脸生成领域的扎实积累和前沿创新,阿里云视频云与香港科技大学合作的最新研究成果《基于生成对抗网络的深度感知人脸重演算法 》...
人脸超分通常依赖人脸先验信息进行细节复原并保持身份信息。受益于GAN先验信息辅助,近来人脸超分取得了长足发展:或者采用复杂的模块对...
4年前,中国首次独立4K修复的经典影片《盗马贼》展露新颜,全国人民都见证了这部老电影焕然一新的一面,这是国内第一次推出独立进行4K修...
CVPR(IEEE Conference on Computer Vision and Pattern Recognition)作为计算机视觉和模式识别领域的顶级会议,在全球具有极高的权威...
虽然ViT在计算机视觉方面取得了巨大的成功,但巨大的计算成本阻碍了它们在密集的预测任务上的应用,如在移动设备上的语义分割。在本文中...
为了更好地认识这个纷繁复杂的世界,人类进化出了一套独特的视觉系统——中央凹成像系统,即当我们看东西时,眼睛聚焦的地方会看得更加清...
Kindle 走了,国产电子书阅读器品牌正在前所未有的崛起。而伴随着技术的进步,彩色电子纸屏幕正在逐步替代黑白墨水屏。
3月30日,阿里云视频云在线上举行了一场由虚拟人助力主持的「智能媒体生产」产品升级发布会,活动围绕产品能力的展现、视频生产流程的革...