梁德澎 - 极术社区 - 连接开发者与智能计算生态

梁德澎

755 声望

github：[链接]知乎：[链接] 展开

关注他

关注了

12

粉丝数

14

IP 属地广东

他的主页他的提问他的回答他的文章他的关注他的粉丝

他的收藏声望记录

最新动态

发布了文章 · 2023年02月16日

一文理解“上下文学习”----大语言模型突现能力

最近几年大语言模型（LLM）获得了越来越多的关注，其中最知名的当属 GPT-3[6] 模型。GPT-3 模型展现了一些大模型才具备的突现能力（就是模型规模必须得增大到一定程度才会显现的能力，比如至少百亿级），其中一项能力就是上下文学习（In-Context Learning）[1,2,3,4,5]。
发布了文章 · 2022年02月02日

一文读懂 Pytorch 中的 Tensor View 机制

GiantPandaCV导语：本文主要内容是，通过图文结合的方式向读者讲解Pytorch的view 机制的原理。
发布了文章 · 2021年12月06日

MosaicML Composer 库炼丹技巧总结

参考文献：Train Short, Test Long: Attention with Linear Biases Enables Input Length Extrapolation， [链接]
发布了文章 · 2021年12月05日

Oneflow 框架添加算子实践 ---- expand 和 repeat

expand 算子的功能简单来说就是，能够实现将输入张量的沿着大小为 1 的维度进行复制，至于复制多少份由第二个参数决定（下面将该参数称为 expand_size）。
关注了专栏 · 2021年12月05日

AIWalker

夯实深度学习知识基础, 涵盖动态滤波，超分辨，轻量级框架等
关注了专栏 · 2021年12月05日

专利解密

从专利出发，浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术
发布了文章 · 2021年03月31日

一文学会 Pytorch 中的 einsum

本文首发于 GiantPandaCV 公众号：一文学会 Pytorch 中的 einsumGiantPandaCV导语：本文主要内容是关于如何理解 Pytorch 中的爱因斯坦求和（einsum），并结合实际例子讲解和 Pytorch C++实现代码解读，希望读者看完本文后可以掌握 einsum 的基本用法。
关注了用户 · 2021年03月31日

脑极体

从技术协同到产业革命，从智能密钥到已知尽头
关注了专栏 · 2021年03月31日

脑极体

写让你脑洞大开且能看懂的人工智能、流媒体、海外科技
发布了文章 · 2021年01月30日

InstanceNorm 梯度公式推导

【GiantPandaCV导语】本文主内容是推导 InstanceNorm 关于输入和参数的梯度公式，同时还会结合 Pytorch 和 MXNet 里面 InstanceNorm 的代码来分析。
发布了文章 · 2020年08月20日

Oneflow 实现强化学习玩 Flappy Bird 小游戏

本文主要内容是如何用Oenflow去复现强化学习玩 Flappy Bird 小游戏这篇论文的算法关键部分，还有记录复现过程中一些踩过的坑。
赞了文章 · 2020年07月15日

Arm中国“星辰”处理器量产！与Cortex-M有何区别？

“星辰”处理器也可以称之为中国的Cortex-M，不过两者没有很大的交叠。授权转自微信公众号：芯基建作者：吴优
关注了专栏 · 2020年07月03日

极术公开课订阅

订阅极术公开课，即时获取最新技术公开课信息
赞了文章 · 2020年05月28日

深度学习系统杂谈

两年前，当我参与到深度学习软件系统的研发和优化时，一个观念逐渐在我脑海中形成——相关的软硬件系统会逐步收敛成标准，或一两个巨无霸。两年过去了，深度学习生态有了很大的变化。
赞了文章 · 2020年05月27日

是什么引起了各个框架 Resize 操作的结果不同？——来自 ONNX 的标准化尝试

炼丹师在转换模型的时候，经常会发现给转换前后的模型输入同样的图片，模型结果有微小的差别。其中的原因有数值算法的误差、不同 jpeg 解码库产生的结果不同等等，也有不同框架内部对某些算子的实现差异。
赞了文章 · 2020年05月26日

卷积神经网络性能优化

原文来自我的博客。本文包含集中常见方法以及 QNNPACK 优化方法的介绍。数学公式可能有排版问题，可参考原文。采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可授权，转载请注明出处。
发布了文章 · 2020年05月26日

移动端arm cpu优化学习笔记第4弹--内联汇编入门（下）

本文主要内容是介绍ARMv7和v8内联汇编的一些基础知识，并且会结合两个具体例子去看下如何用内联汇编来改写原来的代码。作者：梁德澎首发知乎：[链接]
赞了文章 · 2020年05月25日

通用矩阵乘（GEMM）优化与卷积计算

气象预报、石油勘探、核子物理等现代科学技术大多依赖计算机的计算模拟，模拟计算的核心是表示状态转移的矩阵计算。另一方面，计算机图形处理以及近年来兴起的深度学习也和矩阵乘高度相关。而矩阵乘对计算资源消耗较大，除了计算机体系结构的不断更新外，软件优化方面也有大量的研究工作。
赞了文章 · 2020年05月22日

神经网络量化简介

原载于黎明灰烬博客。采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可授权，转载请注明出处。文章是从 Neural Network Quantization Introduction 转译而来，因此有些翻译感，对原文感兴趣亦可直接查看。如果公式和文字的联系对你比较重要，建议参考原文。
关注了专栏 · 2020年05月14日

Tengine-边缘AI推理框架

Tengine是一款轻量级模块化高性能的神经网络推理引擎；欢迎体验Tengine，[链接] 《Tengine开发者入门资料包》[链接]
点击载入更多

认证与成就

获得 70 次点赞

2019年09月23日加入

举报他

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息