极术社区
注册
首页
Top 专栏
读书
专题
问答
公开课
活动
注册 · 登录
▲
嵌入式AI
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
关注专栏
管理
关注数
18934
内容数
1438
最新文章
爱笑的小姐姐
· 2024年07月31日
SGLang:LLM推理引擎发展新方向
21
阅读 5.3k
AI学习者
· 2024年07月22日
图解大模型计算加速系列:vLLM源码解析3,Prefix Caching
23
阅读 2.4k
AI学习者
· 2024年07月08日
窥探Triton的lower(二)
17
阅读 2.3k
爱笑的小姐姐
· 2024年07月02日
北理工提出 LTrack 双摄像头系统 | 专注于暗场景多目标跟踪,自动驾驶和夜间监控的福音!
6
阅读 4k
爱笑的小姐姐
· 12 小时前
CARL2010:一种利用领域特定语言可重构性的方法论
0
阅读 50
爱笑的小姐姐
· 1 天前
Strong-Baseline架构,无特征增强问鼎反无人机挑战赛
0
阅读 138
爱笑的小姐姐
· 2 天前
Tensor-001 矩阵乘法分块乘法概述
0
阅读 248
爱笑的小姐姐
· 5 天前
高分辨率特征+多分支交互注意力,先验增强攻克噪声模糊,3个数据集mAP全面领跑
1
阅读 356
爱笑的小姐姐
· 6 天前
DeepSeek-V3+SGLang: 推理优化
7
阅读 991
爱笑的小姐姐
· 4月9日
视觉反馈驱动+动态规则细化,7B模型性能跃升50%,碾压10倍大模型
1
阅读 656
爱笑的小姐姐
· 4月7日
TVM Relax:通过跨层次抽象实现动态 shape 的 LLM 高效部署
2
阅读 644
爱笑的小姐姐
· 4月3日
分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的技巧
3
阅读 726
爱笑的小姐姐
· 4月2日
Mobile-MMLU:专注真实端侧场景下大模型性能厮杀的 Benchmark 数据集
1
阅读 759
爱笑的小姐姐
· 4月1日
MQA/GQA/YOCO/CLA/MLKV笔记: 层内和层间KV Cache共享
1
阅读 702
爱笑的小姐姐
· 3月31日
HPCA2015:基于机器学习的 GPGPU 性能与功耗估计模型
13
阅读 1.2k
爱笑的小姐姐
· 3月28日
32B 本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
1
阅读 699
爱笑的小姐姐
· 3月28日
[张量/序列并行]图解 DeepSpeed-Ulysses & Megatron-LM TP/SP
6
阅读 664
爱笑的小姐姐
· 3月27日
LLMPerf:GPU 性能建模与大型语言模型的融合
0
阅读 836
爱笑的小姐姐
· 3月25日
Branch-Merge 蒸馏:大语言模型压缩的革命性突破
1
阅读 742
爱笑的小姐姐
· 3月24日
从零开始设计 SGLang 的 KV Cache
2
阅读 842
爱笑的小姐姐
· 3月21日
YOLO LwF 破局持续目标检测 | 自蒸馏+重放记忆双引擎,单阶段检测器告别灾难性遗忘
0
阅读 821
爱笑的小姐姐
· 3月19日
AI 能看懂细节了!IDEA 研究院多模态目标检测模型 DINO-XSeek,自然语言精准定位目标
1
阅读 903
爱笑的小姐姐
· 3月18日
轻量化+动态上采样,参数减38%、精度升4.1%,边缘设备实时部署
1
阅读 827
爱笑的小姐姐
· 3月17日
详解 vLLM 和 SGLang awq dequantize kernel 的魔法
1
阅读 746
爱笑的小姐姐
· 3月14日
从 DeepSeek MoE 专家负载均衡谈起
3
阅读 868
爱笑的小姐姐
· 3月12日
实例特定 Bottleneck+ 非对称解耦 Head,边缘设备精度突破新高度
0
阅读 856
爱笑的小姐姐
· 3月10日
SGLang MLA 实现解析
1
阅读 837
爱笑的小姐姐
· 3月7日
美团基于 SGLang 提供 INT8 无损满血版 DeepSeek R1 部署方案
11
阅读 1k
爱笑的小姐姐
· 3月6日
革新文本-图像检索,视觉 Prompt 预测+轻量训练性能超 BLIP2
1
阅读 840
爱笑的小姐姐
· 3月4日
ViT架构革新,Jumbo增强CLS Token,小模型性能涨13.5%,跨模态推理高效无损
0
阅读 1.1k
爱笑的小姐姐
· 2月28日
分析一下 EP 并行和 DeepSeek 开源的 DeepEP 代码
6
阅读 1.6k
爱笑的小姐姐
· 2月27日
可学习AttentionPredictor:实现16倍KV缓存压缩与Attention加速
1
阅读 1.2k
爱笑的小姐姐
· 2月26日
NV GPU Debug 实用指南(如何监控真实 GPU 利用率,正确判断是否重启 GPU 等)
1
阅读 906
爱笑的小姐姐
· 2月25日
苹果把台灯做成机器人!能用动作表达情绪,重新定义机器人交互
1
阅读 912
上一页
1
2
3
4
5
…
下一页
专栏作者
爱笑的小姐姐
7725 声望 · 18984 粉丝
AI学习者
11449 声望 · 12401 粉丝
棋子
13940 声望 · 4697 粉丝
下冰雹
6540 声望 · 1680 粉丝
小白会长
60 声望 · 0 粉丝
Jack-Cui
370 声望 · 4 粉丝
Xiaohang
80 声望 · 3 粉丝
云鹤
605 声望 · 1862 粉丝
nihui
735 声望 · 21 粉丝
AI老铁
2100 声望 · 898 粉丝
黎明灰烬
285 声望 · 2 粉丝
张新栋
1625 声望 · 12 粉丝
Rocky X
755 声望 · 2 粉丝
圈圈虫
777 声望 · 32 粉丝
梁德澎
755 声望 · 14 粉丝
派大星
2680 声望 · 18 粉丝
Hanson
110 声望 · 8 粉丝
杨二凯
1508 声望 · 29 粉丝
极术小姐姐
64602 声望 · 60159 粉丝
JackLi
2384 声望 · 40 粉丝
关注极术微信号
实时接收点赞提醒和评论通知
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
关注安谋科技招聘
实时获取安谋科技中国职位信息
用户指南
·
用户协议
·
隐私政策
关于我们
·
联系合作
粤ICP备18004469号
粤公网安备 44030502008014号
版权所有 © 2025 极术社区
由
SegmentFault
提供技术支持
友情链接
安谋科技
安创空间
开源中国
InfoQ
边缘计算社区
21IC 电子网
HarmonyOS 技术社区
电子芯吧客
CSDN
全志在线
芒果派
深度强化学习实验室
智东西