hello,本期是AI简报20210521期,共为您带来10条资讯,2条福利。阅读全文预计需要10分钟,请客官享用~
AI芯片
1. IBM 造出首颗 2nm 芯片,性能提升多少?
原文:
https://mp.weixin.qq.com/s/ac...
参考:
IBM 站到世界的最前沿,芯片产业迎来又一个里程碑,摩尔定律再次被拯救,这就是 2021 年 5 月 6 日,全球芯片产业界所发生的事。当日,IBM 于官网宣布推出全球首创的 2 纳米芯片技术,“为半导体领域开辟了新的领域”。当下,业内只有台积电、三星实现了 3nm 制程芯片的研发,且尚未实现量产,2nm 芯片确为业界首创。根据外媒披露的情况来看,IBM 2nm 芯片的晶体管密度可以达到每平方毫米 3.33 亿个 (MTr/mm2)。同时,从 IBM 官网披露的图片来看,该 2nm 芯片采用了 GAA(Gate-All-Around,环绕栅极晶体管)工艺,也为该项工艺后续的普及打下了坚实的基础。2nm 芯片研制成功,意味着各项指标都会出现大幅提升。IBM 对外表示:“与当今最先进的 7 nm 节点芯片相比,预计它将实现 45%的性能提高或 75%的能耗降低。”
IBM的历代芯片工艺开发都很强:
7nm:IBM 2015年开发,台积电2018年量产;
5nm:IBM 2017年开发,台积电2020年量产;
2nm:IBM 2021年开发,台积电量产预计2024年了。
AI前沿
2. 无人机应用于精细化农林业丨宾夕法尼亚大学GRASP实验室项目
原文:
3. CVPR 2021 | 不需要标注了?看自监督学习框架如何助力目标检测
原文:
https://mp.weixin.qq.com/s/-3Yq\_Vmt0GHG3Gq\_jkVW\_g
论文:
一辆自动驾驶汽车每天会产生超过 1TB 的数据,但仅有不到 5% 的数据被最终利用。因此,为了充分利用海量未标注的数据,在没有手工标注的数据上进行学习就显得尤为重要。虽然近年来人们对语言和视觉方面自监督学习的关注越来越大,但点云方面的自监督学习仍然相对比较落后。这一现状激发了轻舟智航和约翰霍普金斯大学学者的研究兴趣。在这篇论文中,来自轻舟智航、约翰霍普金斯大学的研究者提出了一个自监督学习框架,利用激光雷达和相机的自监督学习进行点云运动估计。
4. 业内首发!快手实现基于深度学习实时变声直播
原文:
近日,快手成为业内首次在 PC 客户端实现基于深度学习实时变声直播的公司。这项变声技术可以实现任意用户到目标音色的稳定变声,变声后语音具有自然度高,相似度高,音质清晰等优势,同时整个系统的链路延迟可低至 200 毫秒。
5. 用Transformer进行图像语义分割,性能超最先进的卷积方法!
原文:
https://mp.weixin.qq.com/s/Di...
论文:
https://arxiv.org/abs/2105.05633
代码:
这个最终被命名为Segmenter的语义分割模型,主要基于去年10月份才诞生的一个用于计算机视觉领域的“新秀”Transformer:Vision Transformer,简称ViT。ViT有多“秀”呢?ViT采用纯Transformer架构,将图像分成多个patches进行输入,在很多图像分类任务中表现都不输最先进的卷积网络。缺点就是在训练数据集较小时,性能不是很好。Segmenter作为一个Transformer的编码-解码架构,利用了模型每一层的全局图像上下文。基于最新的ViT研究成果,将图像分割成块(patches),并将它们映射为一个线性嵌入序列,用编码器进行编码。再由Mask Transformer将编码器和类嵌入的输出进行解码,上采样后应用Argmax给每个像素一一分好类,输出最终的像素分割图。
6. 搜狗发布全球首个手语AI合成主播,用技术造福听障人群
原文:
在今年的搜狐5G&AI峰会上,搜狗发布了最新一代AI合成主播——全球首个手语AI合成主播“小聪”。“小聪”使用了行业最领先的3D重光照扫描还原、面部肌肉驱动、表情肢体手势捕捉技术,生产出了高度还原真人发肤、形象逼真、动作自然生动的数字人模型,数字人写实度的大幅突破则能够显著提升手语播报的真实感与亲切感,从而提高播报用户体验。搜狗说,在测评中“小聪”的可懂度达到了85%以上,相比纯文字传达信息的效率有明显提高,能有效帮助听障人士克服理解障碍。
AI工具
7. Python 之父爆料:明年至少令 Python 提速 1 倍!
原文:
在 5 月 13 日“2021 年 Python 语言峰会”上,Python 之父 Guido van Rossum 作了一场《Making CPython Faster》的分享,他已经投入了这项计划!据 Guido 爆料,他因为“退休”无聊,申请加入了微软,因此组建起一个小团队。目前成员除了他还有两个:Eric Snow(Python 核心开发者之一、微软高级工程师)和 Mark Shannon(本文第一段那个计划的提出者,精通 Python 性能研究)。整个计划被称为“香农计划”(即“Shannon Plan”,得名于提出者),期望花 4 年时间把 Python 提速 5 倍,即每年 1.5 倍。现在短期的计划是在 Python 3.11 版本中实现至少提速 1 倍。按照官方的发布周期,今年 10 月会发布 3.10 版本,而 3.11 版本将在 2022 年 10 月发布。
8. 清华「计图」现在支持国产芯片了!动态图推理比PyTorch快了270倍
原文:
清华自研的深度学习框架计图(Jittor)在动态图推理速度上又一次完胜PyTorch。最近,计图团队完成了在寒武纪芯片MLU270上的移植。这一次跟寒武纪的合作,使Jittor在backbone网络模型中的动态图推理速度较PyTorch平均提升了276.69倍。从团队公布的实验结果可以看到,在寒武纪芯片上分别用计图(Jittor)和PyTorch进行推理。计图(Jittor)在16种backbone网络模型中的推理速度都较PyTorch大幅提升,其中包括alexnet、vgg系列、resnet系列。其中最快的是alexnet,提升速度达到了464.43倍,最慢的resnet50也达到了153倍。平均提升速度达276.69倍。
开源项目
9.yolov5部署到iPhone或终端实践全过程
原文:
https://mp.weixin.qq.com/s/Qo...\_02Kig2jA
自己动手为自己的手机部署一个目标检测模型!
10.阿里推出最强无监督行人重识别方法 Cluster Contrast ReID,精度超越有监督算法
原文:
https://zhuanlan.zhihu.com/p/...
论文:
https://arxiv.org/abs/2103.11568
代码:
在行人重识别领域,如何获取海量标注数据,提高实际场景的重识别能力是工业界非常关注的一个问题。通常在学术界上公开数据集如Maket1501上训练出来的模型在实际场景上基本是没法用的,都需要在实际场景中采集数据并进行标注。标注需要人工成本和时间周期,在项目比较急的时候重新标注根本来不及,因此无监督的行人重识别方法成为了目前研究的一个热点。阿里提出了无监督Cluster Contrast ReID,在Market1501上跑到了rank-1 94.6%,已经超越了很多有监督的算法。在其他行人重识别数据集如Duke和MSMT17数据集上,也比最先进无监督re-ID方法mAP提高了7.5%,6.6%。
文末福利
CUDA编程小练习
原文:
https://www.zhihu.com/column/c\_1360656323416215552
持续更新!为你的嵌入式AI打好基础!本系列从准备开发环境开始,详细介绍CUDA编程!对一知半解但又兴趣的小白非常友好!本系列针对的读者是有一点点编程基础的同学,如果你自己学习了CUDA,不知道如何深入,怎么实践,不妨持续关注本系列!
还在为打开Github慢发愁?提高国内访问 Github 速度的 9 种方法
原文:
因为某些原因,github 访问速度确实太慢了,图片经常刷不出来,甚至会出现项目无法下载的情况。
今天,给大家推荐几种提高 github 访问速度的方案,挑自己喜欢的尝试就好!为你的开源之路搭上高速!
推荐阅读
【RW007系列综合实战1】STM32+RW007实现BLE透传功能
【AI简报20210514期】开源项目树莓派复古相机、L4自动驾驶新闻速递
【RW007系列连载1】RW007-BLE主机通信使用学习示例与综合Demo
原文链接:RTThread物联网操作系统
作者: XianKing