我们一直在探索各种减少高级神经网络的内存需求的技术。这些技术之一是量化,其中神经网络权重和激活以较低的位宽格式存储,从而降低了总体存储需求。
作者:Matthew Mattina
阅读直达链接:https://community.arm.com/developer/research/b/articles/posts/alpha-blending-quantizing-networks-without-using-the-ste欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏。