首发:AI公园公众号作者:Noé 编译:ronghuaiyang导读回顾了场景文本检测和识别领域的3篇论文,分别是检测,识别以及端到端的方法。基于...
论文题目:HybridPose: 6D Object Pose Estimation under Hybrid Representations
NeurIPS终于放榜,提交数再次创新高,与去年相比增加了38%,共计达到9454篇,总接收1900篇,其中谷歌以169篇傲视群雄,清华大学63篇,南...
由于云芯一号比较难配置静态外网ip,笔者每次连接云芯一号都需要大费周折地通过连接显示屏和键盘来查看云芯一号的内网ip地址,或者通过...
这是一篇关于图像分割损失函数的总结,具体包括:Binary Cross EntropyWeighted Cross EntropyBalanced Cross EntropyDice LossFocal lo...
本文认为,anchor based和anchor free物体检测方法的本质区别在于如何选择样本,文章通过实验验证了这个想法,并提出了一种自动选取样本...
刚刚过去的国庆长假,使交通拥堵再度成为焦点。日前,飞腾携手同有科技推出 交通行业全闪存联合解决方案,为全国交通运输行业车辆信息数...
激光三角测量法,是工业视觉领域较为常用也是比较容易理解的一种3D检测算法。本文主要从应用层次来阐述,包括相机和激光选型、搭接方式...
来源:OpenCV学堂投稿作者:小黄弟 来自:中国电科智慧城市建模仿真与智能技术重点实验室文字编辑:gloomyfish
这篇文章收录于ECCV2020,由北京大学、商汤科技、香港中文大学提出的基于RGB-D图像的语义分割算法。充分考虑了RGB图像信息和深度信息的...
首发:AI公园公众号作者:Rohan Jagtap 编译:ronghuaiyang导读掌握这些可以更高效的模型的提高开发效率。TensorFlow 2.x在构建模型和Te...
该论文利用了城市场景图像的内在特征,并提出了一个通用的附加模块,称为高度驱动的注意力网络(HANet),用于改善城市场景图像的语义分...
人类具有一双眼睛,对同一目标可以形成视差,因而能清晰地感知到三维世界。因此,计算机的一双眼睛通常用双目视觉来实现,双目视觉就是...
市场调研机构 Strategy Analytics 两年前的预测曾指出,到 2023 年,语音助手渗透率将达到 90%。而在各大手机厂商的推动下,手机语音助...
这篇文章来自商汤科技,是OpenImage竞赛的冠军方案,本文对物体检测中的分类和回归任务的冲突问题进行了重新的审视,并给出了一个为不同...
这是众多Anchor Free中比较有影响力的一篇文章,不光是效果好,而且思路清楚,简单,不需要任何trick,并将众多的视觉任务统一到了一个...
WACV2021的一篇文章,将CenterNet的方案用到了旋转物体的检测中,设计了一种精巧的旋转框表达方式,免去了设计anchor麻烦,效果也非常好...
近期,基于 TensorFlow 的隐私 AI 框架 Rosetta 正式开源([链接])。借助 Rosetta,AI 开发者不需要了解密码学等隐私保护技术,只需要...
【Happy导语】该文是北邮&南开大学联合提出了一种“即插即用”计算单元,它基于特征冗余而设计,它将输入特征分成两组分别进行处理最后采...
云栖大会云上 Hello World 活动火热进行中!每位参与者都可收获一份阿里云出品的全球唯一序列号纪念证书!