梁德澎 头像

梁德澎

755 声望
github:[链接]知乎:[链接] 展开
关注了
12
粉丝数
14
IP 属地广东
最新动态
  • 发布了文章 ·
    一文理解“上下文学习”----大语言模型突现能力

    最近几年大语言模型(LLM) 获得了越来越多的关注,其中最知名的当属 GPT-3[6] 模型。GPT-3 模型展现了一些大模型才具备的突现能力(就是模型规模必须得增大到一定程度才会显现的能力,比如至少百亿级),其中一项能力就是上下文学习(In-Context Learning)[1,2,3,4,5]。

    摘要图
  • 发布了文章 ·
    一文读懂 Pytorch 中的 Tensor View 机制

    GiantPandaCV导语:本文主要内容是,通过图文结合的方式向读者讲解Pytorch的view 机制的原理。

    摘要图
  • 发布了文章 ·
    MosaicML Composer 库炼丹技巧总结

    参考文献:Train Short, Test Long: Attention with Linear Biases Enables Input Length Extrapolation, [链接]

    摘要图
  • 发布了文章 ·
    Oneflow 框架添加算子实践 ---- expand 和 repeat

    expand 算子的功能简单来说就是,能够实现将输入张量的沿着大小为 1 的维度进行复制,至于复制多少份由第二个参数决定(下面将该参数称为 expand_size)。

  • 关注了专栏 ·
    图标
    AIWalker

    夯实深度学习知识基础, 涵盖动态滤波,超分辨,轻量级框架等

  • 关注了专栏 ·
    图标
    专利解密

    从专利出发,浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术

  • 发布了文章 ·
    一文学会 Pytorch 中的 einsum

    本文首发于 GiantPandaCV 公众号:一文学会 Pytorch 中的 einsumGiantPandaCV导语:本文主要内容是关于如何理解 Pytorch 中的爱因斯坦求和 (einsum) ,并结合实际例子讲解和 Pytorch C++实现代码解读,希望读者看完本文后可以掌握 einsum 的基本用法。

    摘要图
  • 关注了用户 ·
    图标
    脑极体

    从技术协同到产业革命,从智能密钥到已知尽头

  • 关注了专栏 ·
    图标
    脑极体

    写让你脑洞大开且能看懂的人工智能、流媒体、海外科技

  • 发布了文章 ·
    InstanceNorm 梯度公式推导

    【GiantPandaCV导语】本文主内容是推导 InstanceNorm 关于输入和参数的梯度公式,同时还会结合 Pytorch 和 MXNet 里面 InstanceNorm 的代码来分析。

    摘要图
  • 发布了文章 ·
    Oneflow 实现强化学习玩 Flappy Bird 小游戏

    本文主要内容是如何用Oenflow去复现强化学习玩 Flappy Bird 小游戏这篇论文的算法关键部分,还有记录复现过程中一些踩过的坑。

    摘要图
  • 赞了文章 ·
    Arm中国“星辰”处理器量产!与Cortex-M有何区别?

    “星辰”处理器也可以称之为中国的Cortex-M,不过两者没有很大的交叠。授权转自微信公众号:芯基建 作者:吴优

    摘要图
  • 关注了专栏 ·
    图标
    极术公开课订阅

    订阅极术公开课,即时获取最新技术公开课信息

  • 赞了文章 ·
    深度学习系统杂谈

    两年前,当我参与到深度学习软件系统的研发和优化时,一个观念逐渐在我脑海中形成——相关的软硬件系统会逐步收敛成标准,或一两个巨无霸。两年过去了,深度学习生态有了很大的变化。

    摘要图
  • 赞了文章 ·
    是什么引起了各个框架 Resize 操作的结果不同?——来自 ONNX 的标准化尝试

    炼丹师在转换模型的时候,经常会发现给转换前后的模型输入同样的图片,模型结果有微小的差别。其中的原因有数值算法的误差、不同 jpeg 解码库产生的结果不同等等,也有不同框架内部对某些算子的实现差异。

    摘要图
  • 赞了文章 ·
    卷积神经网络性能优化

    原文来自我的博客。本文包含集中常见方法以及 QNNPACK 优化方法的介绍。数学公式可能有排版问题,可参考原文。 采用知识共享 署名-非商业性使用-禁止演绎 4.0 国际许可授权,转载请注明出处。

    摘要图
  • 发布了文章 ·
    移动端arm cpu优化学习笔记第4弹--内联汇编入门(下)

    本文主要内容是介绍ARMv7和v8内联汇编的一些基础知识,并且会结合两个具体例子去看下如何用内联汇编来改写原来的代码。 作者:梁德澎首发知乎:[链接]

    摘要图
  • 赞了文章 ·
    通用矩阵乘(GEMM)优化与卷积计算

    气象预报、石油勘探、核子物理等现代科学技术大多依赖计算机的计算模拟,模拟计算的核心是表示状态转移的矩阵计算。另一方面,计算机图形处理以及近年来兴起的深度学习也和矩阵乘高度相关。而矩阵乘对计算资源消耗较大,除了计算机体系结构的不断更新外,软件优化方面也有大量的研究工作。

    摘要图
  • 赞了文章 ·
    神经网络量化简介

    原载于黎明灰烬 博客。采用知识共享 署名-非商业性使用-禁止演绎 4.0 国际许可授权,转载请注明出处。文章是从 Neural Network Quantization Introduction 转译而来,因此有些翻译感,对原文感兴趣亦可直接查看。 如果公式和文字的联系对你比较重要,建议参考原文。

    摘要图
  • 关注了专栏 ·
    图标
    Tengine-边缘AI推理框架

    Tengine是一款轻量级模块化高性能的神经网络推理引擎 ;欢迎体验Tengine,[链接] 《Tengine开发者入门资料包》[链接]

认证与成就
获得 70 次点赞
2019年09月23日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息