旷视研究院 头像

旷视研究院

2210 声望
他还没有填写个人简介
关注了
1
粉丝数
2072
最新动态
  • 发布了文章 ·
    旷视研究院获 IROS 2021 The HILTI SLAM 挑战赛冠军

    近日,IROS 2021 The HILTI SLAM 挑战赛公布了竞赛结果,旷视研究院荣获此次挑战赛的冠军。这是继去年包揽 CVPR 2020 SLAM 挑战赛全部赛道的冠军后,旷视研究院再次获得顶会 SLAM 竞赛的冠军

    摘要图
  • 发布了文章 ·
    技术的真相 | 视频智能分析之Web视频播放通用解决方案

    通常,摄像机H265视频编码在传输快、存储小、画质高等方面的优势使得其备受企业青睐,但是由于主流浏览器不能够支持这种格式,因此在浏览器下播放和解析视频都受到一定的约束。那么,如何实现 Web 视频播放的通用就成为了我们必须研究的课题。本期技术的真相将带你了解旷视盘古系统是如何解决 Web 视频播放通用方案这一...

    摘要图
  • 发布了文章 ·
    MegEngine| CUDA 矩阵乘法终极优化

    单精度矩阵乘法(SGEMM)几乎是每一位学习 CUDA 的同学绕不开的案例,这个经典的计算密集型案例可以很好地展示 GPU 编程中常用的优化技巧,而能否写出高效率的 SGEMM Kernel ,也是反应每一位 CUDA 程序员对 GPU 体系结构的理解程度的优秀考题。本文将详细介绍 CUDA SGEMM 的优化手段,适合认真阅读过《CUDA C++Programm...

    摘要图
  • 发布了文章 ·
    技术的真相 | 你真的知道如何实现无人自动化仓储吗?

    随着电商行业的蓬勃发展,企业为提升服务效率与质量,对无人自动化的物流仓储需求激增,随之而来的则是要解决,如何能合理调配无人仓储中的多种设备的技术难点。本期技术的真相带大家了解一种通用接驳逻辑的设计和实现。

    摘要图
  • 发布了文章 ·
    旷视天元开源 MegFlow 流式计算框架,助力 AI 应用快速落地

    关于程序员为什么喜欢养猫的回答,网友们给出了很多答案,比如一边吸猫一边写代码,效率更高;养猫不容易脱发;更容易交到女朋友(偷笑)……

    摘要图
  • 发布了文章 ·
    CVPR2021 论文解读Vol.11|“自底向上”人体姿态估计中关节点的尺度与不确定性分析

    论文标题:Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation

    摘要图
  • 发布了文章 ·
    技术的真相 | 基于双边滤波的磨皮算法及优化

    现在视频类应用非常火热,直播、美妆、医美应用层出不穷。用户们在使用这类应用时都希望自己在屏幕上的样子美美的,皮肤细腻光滑。本文就介绍一种实现简单、效果很好的磨皮算法以及对它的优化思路。

    摘要图
  • 发布了文章 ·
    CVPR 2021 论文解读Vol.10 | 通用实例蒸馏GID:青出于蓝而胜于蓝

    论文标题:General Instance Distillation for Object Detection

    摘要图
  • 发布了文章 ·
    YOLOX:高性能目标检测的最新实践 | 报告详解

    近年来,目标检测的工程应用研究中,YOLO系列以快速响应、高精度、结构简单以及容易部署的特点备受工程研究人员的青睐。同时,YOLO系列存在需要手工设定样本正负导致模型泛化能力较差的问题。为了解决此类问题,旷视科技研究院BaseDetection组结合学术界先进成果和工程实践的要求,提出了YOLOX。

    摘要图
  • 发布了文章 ·
    CVPR 2021 论文解读Vol.9 | 多样化分支模块:将卷积构建为类似Inception的单元

    从题目上可以看出本工作的重点在于提出了一个多样性分支模块(DBB),这个模块类似于Inception单元。前人的工作已经证明Inception模块已经证明多分支拓扑以及不同规模和复杂度的各种路径的组合可以丰富提取的特征空间以提高性能。但是这样复杂的结构在验证时会降低速度。一般对于神经网络模型的应用都是先在强大的GPU工...

    摘要图
  • 发布了文章 ·
    CVPR 2021论文解读Vol.8 | UPFlow:基于特征金字塔结构的无监督光流估计学习

    论文标题:UPFlow: Upsampling Pyramid for Unsupervised Optical Flow Learning

    摘要图
  • 发布了文章 ·
    技术的真相 | 从AR口红试妆了解人工智能试妆技术

    随着人工智能技术的不断发展,各大美颜软件的妆容变得越来越“自然无痕迹”,大家可能会好奇这背后的技术原理是什么。因此,本期“技术的真相”将通过简易的AR口红试妆带大家走进虚拟试妆技术。

    摘要图
  • 发布了文章 ·
    ICCV 2021 官宣啦!旷视研究院入选论文亮点解读!

    近日,两年一度的国际计算机视觉大会 ICCV 2021( IEEE International Conference on Computer Vision)公布了最终的接收论文决定。在官方公布中,旷视研究院共有9 篇论文(含2篇Oral)被成功收录。

    摘要图
  • 发布了文章 ·
    利用共享内存实现比NCCL更快的集合通信

    从 2080Ti 这一代显卡开始,所有的民用游戏卡都取消了 P2P copy,导致训练速度显著的变慢。针对这种情况下的单机多卡训练,MegEngine中实现了更快的集合通信算法,对多个不同的网络训练相对于NCCL有3%到10%的加速效果

    摘要图
  • 发布了文章 ·
    CVPR 2021 论文解读Vol.7 | “自底向上”人体姿态估计的尺度自适应方法

    本文针对基于自底向上方法的人体姿态估计中人体尺度不一的问题,提出了尺度自适应热图回归方法(SAHR)——根据人体的尺度大小动态地调整相应关键点热图高斯核的标准差。

    摘要图
  • 发布了文章 ·
    CVPR 2021 Image Matching 挑战赛双冠算法:揭秘AR导航背后的技术

    在刚刚结束的 CVPR 2021 Image Matching 比赛中,旷视研究院 3D 组取得了两冠一亚的成绩。Image Matching (图像匹配)是计算机视觉领域最基础的技术之一,它是指通过稀疏或者稠密特征匹配的方式,将两幅图像相同位置的局部信息进行关联。Image Matching 在很多领域均有广泛应用,如机器人、无人车、AR/VR、图像/商品检...

    摘要图
  • 发布了文章 ·
    深度学习算子优化-FFT

    我们日常“加工”的图像都是像素级,被称为是图像的空域数据。空域数据表征我们“可读”的细节。如果我们将同一张图像视为信号,进行频谱分析,可以得到图像的频域数据。观察下面这组图,频域图中的亮点为低频信号,代表图像的大部分能量,也就是图像的主体信息。暗点为高频信号,代表图像的边缘和噪声。从组图可以看出,Deg...

    摘要图
  • 发布了文章 ·
    CVPR 2021 论文解读Vol.6 I 动态区域感知卷积,进一步提升分类/检测/分割性能

    旷视研究院提出一种新颖的卷积方式,名为动态区域感知卷积(DRConv),它能为特征具有相似表示的相应空间区域自动地分配定制卷积核,相较标准卷积,这种卷积方式大大地增强了对图像语义多样性的建模能力。DRConv通过可学习的指示器(learnable instructor)将逐步增加的通道维卷积核变换至空间维,这一方面增强了卷积的表征...

    摘要图
  • 发布了文章 ·
    赛场上的 AI 务实派:经典招式,也能作出“新解”!

    参赛结果超出了预期,更重要的是也意识到了自己的不足,可以让我们更好地进步。 ——旺仔QQ糖在比赛中得到了很好的锻炼,也达到了预期目标,还算成功。—— Fishtrack对于第一届中国农业人工智能创新创业大赛的亚军、季军队伍来说,一个月的比赛时间,他们收获的不仅是荣誉,还有更多的成长。旺仔QQ糖:用“旧”方法,解决“新”...

    摘要图
  • 发布了文章 ·
    Fast Run:提高 MegEngine 模型推理性能的神奇功能

    对于深度学习框架来说,网络的训练/推理时间是用户非常看中的。在实际生产条件下,用户设计的 NN 网络是千差万别,即使是同一类数学计算,参数也各不相同。如果没有针对性的优化,框架就完全丧失竞争力。因此,在一类数学计算中,开发者们会开发多种高效的算法,分别适用于不同的参数,以保证网络的性能。接下来开发者们...

    摘要图
认证与成就
获得 35 次点赞
2020年01月08日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息