目标检测有2种主流:top-down和bottom-up。最先进的方法大多属于第一类。在本文中,作者证明了bottom-up方法与top-down的方法具有同样的...
图像分类 (image classification) 是视觉人工智能的最基础应用,目前 TAO 模型训练工具支持 resnet、vgg、mobilenet_v1、mobilenet_v2、...
随着技术的发展和超视频化的时代驱动,交互的形式日渐丰富。从屏幕点触,到语音交互,人脸、指纹、声纹,再到近年流行的AR和VR……人类早...
本文介绍了YOLO-Pose,一种新的无Heatmap联合检测方法,是基于YOLOv5目标检测框架的姿态估计。现有的基于Heatmap的两阶段方法并不是最优...
凭借在人脸生成领域的扎实积累和前沿创新,阿里云视频云与香港科技大学合作的最新研究成果《基于生成对抗网络的深度感知人脸重演算法 》...
人脸超分通常依赖人脸先验信息进行细节复原并保持身份信息。受益于GAN先验信息辅助,近来人脸超分取得了长足发展:或者采用复杂的模块对...
4年前,中国首次独立4K修复的经典影片《盗马贼》展露新颜,全国人民都见证了这部老电影焕然一新的一面,这是国内第一次推出独立进行4K修...
CVPR(IEEE Conference on Computer Vision and Pattern Recognition)作为计算机视觉和模式识别领域的顶级会议,在全球具有极高的权威...
虽然ViT在计算机视觉方面取得了巨大的成功,但巨大的计算成本阻碍了它们在密集的预测任务上的应用,如在移动设备上的语义分割。在本文中...
为了更好地认识这个纷繁复杂的世界,人类进化出了一套独特的视觉系统——中央凹成像系统,即当我们看东西时,眼睛聚焦的地方会看得更加清...
Kindle 走了,国产电子书阅读器品牌正在前所未有的崛起。而伴随着技术的进步,彩色电子纸屏幕正在逐步替代黑白墨水屏。
3月30日,阿里云视频云在线上举行了一场由虚拟人助力主持的「智能媒体生产」产品升级发布会,活动围绕产品能力的展现、视频生产流程的革...
FLD(Flexible and Lightweight Decoder),它用于降低传统decoder模块的计算负载;
阿里云自研编码器Ali266于2022年1月在优酷正式上线,这是已知的业界首个H.266/VVC标准的编码器商用落地项目。经过两个月的实际运行数据...
结构重参化在各种计算机视觉任务中引起了越来越多的关注。它的目的是提高深度模型的性能,而不引入任何推理时间成本。虽然这种模型在推...
【GiantPandaCV导语】 这是2022年第一个关于YOLO的改版,该版本由百度提出,称之为YOLOE,是目前各项指标sota的工业目检测器,性能sota...
把前沿的技术和时髦的功能下放,以亲民的价格让首次接触产品的用户尝鲜,是不少以技术见长的公司惯用的手法,比如 iPhone SE 就是这个套...
对于一些热衷于 NFT 的用户而言,这绝对是一大利好。作为首个吃螃蟹的人,三星此举可能也会为自身在电视服务上开辟新的增长点。
最近居家的时光里,我试用了一款很特别的投影仪,这是猫王音响曾德钧老师在 2022 年春季为我们带来的全新作品——猫王灵感 P5 投影仪。
在去年的 CES 2021 线上展上,Mojo Vision 开发的 AR 隐形眼镜亮相,以压倒性的票选优势,获得了 CES 最佳新产品竞赛 Last Gadget Stand...
本文对原生ViT(即non-hierarchical)骨干在目标检测中的应用进行了探索,使得原生ViT架构仅需针对目标检测进行微调而无需设计为分层版本...
作为元宇宙「入口」设备,AR/VR 头显正强势回归。近五年来,硬件设备、技术水平、内容生态、创作环境的沉淀和大幅提升,行业生态逐步向...
2022-03-31 周四 12:00 开播 回顾中
在计算机视觉中,知识蒸馏是一项无损增强模型的技术手段,除了最开始的上游分类任务,近年来也逐步用于重要的下游任务如目标检测当中。...
继智能驾驶座舱交互技术,视觉,触觉之后。本文将大概介绍下另外三种,听觉,生理传感器,整车状态。听觉技术虽然比较传统但也面临变革...
近期,前Cisco思科首席工程师Thomas Davies已正式加入全球化视频编码及视频AI提供商——微帧科技(Visionular)。
标签分配(Label Assignment,LA)的目的是为每个训练样本分配一个正样本和一个负样本的损失权重,LA在目标检测中起着重要的作用。现有的LA...
作为 iOS 15 的一部分,苹果去年推出了一项名为 Home Key 家门钥匙的智能家居功能。如今,支持苹果 Home Key 功能的智能门锁来了。
根据 3 月 21 日发布的 IDC 最新一期全球 2021 年第四季度和 2021 年全年可穿戴设备市场报告,我们对于过去一年的市场表现做一期复盘。
行人重识别(Person Re-ID)在视频监控、安防及刑侦等领域中都有着巨大的应用前景及价值,其目标是根据一个人物在某个摄像头下的图片(...