旷视研究院 头像

旷视研究院

3200 声望
他还没有填写个人简介
关注了
1
粉丝数
7662
最新动态
  • 发布了文章 ·
    ECCV 2022 | 视频插帧中的实时中间流估计

    本文提出了一种基于实时中间流估计的视频插帧算法 RIFE,包括一个端到端的高效的中间流估计网络 IFNet,以及基于特权蒸馏的光流监督框架。RIFE 支持在两帧之间的任意时刻点插帧,在多个数据集上达到了最先进的性能且不依赖于任何的预训练模型。

    摘要图
  • 发布了文章 ·
    沈向洋对话张祥雨:重新审视CNN中大卷积核问题

    「沈向洋带你读论文」CV系列专栏,本次邀请到旷视研究院基础模型组的负责人张祥雨,为大家讲解论文Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs,重新审视CNN中大卷积核问题。

    摘要图
  • 发布了文章 ·
    ECCV 2022 Oral | 基于EM算法从视频中生成真实光流数据集

    论文地址:[链接]开源代码:[链接]Introduction近年来, 基于深度学习的光流算法实现了很高的性能和运算效率。实现这些深度学习方法的一个关键因素是其训练数据集。我们认为, 光流的数据集应具有以下四个关键特性: 1) 有标签数据对的数量多; 2) 光流标签的准确性高; 3) 图像的真实性高;4) 运动的真实性高。然而, 我们发现...

    摘要图
  • 发布了文章 ·
    提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现

    随着深度学习的发展,其应用场景也越发的广泛与多样。这些多样化的场景往往会对实际的部署提出更加“定制化”的限制。例如,自动驾驶汽车对人体识别的精度要求肯定比图像识别动物分类的精度要求更加严苛,因为二者的应用场景和错误预测带来的后果截然不同。这些“定制化”带来的差异,对于实际部署的模型在精度、速度、空间...

    摘要图
  • 发布了文章 ·
    ECCV 2022 Oral | 自监督学习与量化协同互助

    自监督学习由于可以从未标注的数据中学习到任务无关的通用表征[10], 成为近些年深度学习领域一个研究热点。特别是一系列基于对比学习工作的出现[3, 4, 6, 7], 使得自监督预训练模型在下游任务的表现与有监督学习之间的差异日益减小, 甚至实现超越。这些下游训练的模型经常要被部署到不同资源限制的设备(e.g. 服务器, 手...

    摘要图
  • 发布了文章 ·
    旷视天元 MegEngine 开源 CUDA INT4 量化源码实现

    当下人工智能技术正加速发展,渗透到云、边、端和应用的各个层面,与海量IoT设备进行深度融合,不断拓展应用场景。然而在AIoT场景中,嵌入式设备往往算力有限,难以承载庞大的AI模型。如何在资源有限的终端场景实现 AI 模型的有效部署,是加速AI落地的重要问题。AI 工程师们研发了各种试图缩小模型大小并保持性能的办法...

    摘要图
  • 发布了文章 ·
    旷视研究院荣获 2022 ACM-Multimedia ViCo 比赛冠军

    近日,旷视研究院参加了顶级国际会议 ACMMM 的对话人像视频生成比赛( ViCo Conversational Head Generation Challenge,以下简称 ViCo),荣获 Listening Head Generation 赛道第一名和 Talking Head Generation 赛道第二名。相关论文入选 ACMMM workshop。

    摘要图
  • 发布了文章 ·
    炼丹心得 | 攻坚“大模型”,寻“统一”之道

    在于日前落下帷幕的2022 旷视技术开放日(MegTech 2022)活动上,旷视联合创始人、CEO 印奇表示,“2+1”的 AIoT 核心技术科研体系,是支撑旷视未来不断走向 AIoT 商业化成功的重要基石。

    摘要图
  • 发布了文章 ·
    TracedModule: 更友好的模型表示方案,模型训练到部署的桥梁

    TracedModule 是 MegEngine 中的一种模型格式,用于脱离模型源码对模型进行训练、量化、图手术和模型转换,它是模型训练到部署之间的桥梁。

    摘要图
  • 发布了文章 ·
    MegTech 2022 | 20个Demo闪亮登场,哪一个击中了你的心巴?

    作为旷视一年一度的技术盛会2022旷视技术开放日可谓是盛况空前20个有料有趣的Demo互动体验区覆盖前沿技术探索、软硬件协同设计算法量产应用和商业化产品落地等方面更是让大家感受到了AI独特的魅力虽然同属人工智能但这些Demo都有着鲜明的“个性”今天,就让我们一起回顾一下吧!打破次元壁的Demo:VR裸手交互虚拟与现实之...

    摘要图
  • 发布了文章 ·
    旷视研究院夺得 CVPR AI City Challenge 挑战赛自然语言车辆检索赛道第一

    近日,计算机视觉国际顶级会议 CVPR 的 AI City Challenge 挑战赛(以下简称 AICity)落下帷幕,来自旷视研究院的代表队荣获 Tracked-Vehicle Retrieval by Natural Language Descriptions 赛道冠军。AICity 由 NVIDIA 公司主办,先前已成功举办过五届,AICity 旨在利用 AI 技术来提升城市空间的运营效率。第六届 AICity...

    摘要图
  • 发布了文章 ·
    MegEngine Inference 卷积优化之 Im2col 和 winograd 优化

    在 CV 领域中,卷积计算是扩充像素的感受野的有效方法,模型大多数的计算量都是卷积操作贡献的。因此在 CV 模型的推理性能优化中,最重要的一项工作是对卷积的优化。MegEngine 在长期的工业界实践和反馈的基础上总结得出卷积优化的基本方法有:

    摘要图
  • 发布了文章 ·
    旷视研究院荣获 CVPR 2022 NTIRE RAW 图像多帧超分-真实世界数据赛道比赛第一!

    近日,New Trends in Image Restoration and Enhancement (以下简称:NTIRE)  比赛结果揭晓,旷视研究院在11支参赛队伍中脱颖而出,荣获了 NTIRE 2022 Burst Super-Resolution Challenge-真实世界数据赛道比赛第一!

    摘要图
  • 发布了文章 ·
    技术的真相 | 机器学习在仓库控制中的探索:以某场景的排序问题为例

    作为新一代托盘柔性物流解决方案,旷视智能托盘四向车系统具有高密度存储、场地适应性强、扩展灵活、交付周期短等优势,能为实体企业提供具备更优投资回报比(ROI)的自动化、智能化仓储解决方案。那么,在智能托盘仓库又是如何被设计出来的呢?这背后运用了怎样的分配策略?本期《技术的真相》,让我们一起走进智能托盘...

    摘要图
  • 发布了文章 ·
    MegPeak——让你更懂你的处理器

    在这个算力需求爆炸的大背景下,如何发挥出已有硬件的最大算力变得非常重要,直观一点是:我们需要对现有算法针对特定的处理器进行极致的性能优化,尽量满足目前 AI 算法对算力高要求。为了能够做到极致的性能优化,我们可能的方向有:

    摘要图
  • 发布了文章 ·
    ARM 算子性能优化上手指南

    做 ARM 侧算子开发时,不能不关心的就是性能。本文主要就是介绍 ARM 算子性能优化的常用思路,做为一个入门级的参考。文章以 ARM Cortex a55 上的 GaussianBlur 优化为例展开,并在文末对 ARM 性能优化思路做了一个总结。

    摘要图
  • 发布了文章 ·
    旷视研究院荣获 CVPR 2022 NTIRE 双目图像超分辨率比赛第一!

    近日,New Trends in Image Restoration and Enhancement (以下简称:NTIRE) 比赛结果揭晓,旷视研究院荣获双目图像超分辨率赛道的冠军。NTIRE 即“图像恢复与增强的新趋势”,是近年来计算机图像恢复领域最具影响力的一场全球性赛事,由苏黎世联邦理工学院计算机视觉实验室(Computer Vision Laboratory, ETH Zurich)主...

    摘要图
  • 发布了文章 ·
    论文解读 | 暗视觉网络:利用深度不一致先验的 RGB IR 融合低照度成像方法

    RGB-NIR 融合技术可用在极暗环境下增强可见光成像效果。然而现存的融合算法无法处理 RGB-NIR 图像之间的结构不一致问题,从而难以生成高质量的融合结果。本文中,我们对这个难题进行分析,并提出 Dark Vision Net (DVN)来处理结构不一致问题,通过巧妙的网络设计,DVN 将传统算法的核心思想融合进 CNN 框架之中,从而取...

    摘要图
  • 发布了文章 ·
    论文解读 | 利用自适应图推理的光流学习方法

    光流可以表达视频两帧图像之间的像素级对应关系,它是视频理解和分析领域中的一项基本任务。尽管基于深度学习的方法展示了强大的帧间匹配能力,但现有方法都存在一个明显的问题,即这些方法主要侧重于解决两帧图像的特征之间的匹配相似性,缺乏对给定场景的全局性运动情况进行分析。因此,由运动模糊、遮挡和大运动引起...

    摘要图
  • 发布了文章 ·
    解耦知识蒸馏,让Hinton在7年前提出的方法重回SOTA行列

    与主流的feature蒸馏方法不同,本研究将重心放回到logits蒸馏上,提出了一种新的方法「解耦知识蒸馏」,重新达到了SOTA结果,为保证复现该研究还提供了开源的蒸馏代码库:MDistiller。

    摘要图
认证与成就
获得 142 次点赞
2020年01月08日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息