极术社区
注册
首页
Top 专栏
读书
专题
问答
公开课
活动
注册 · 登录
▲
嵌入式AI
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
关注专栏
管理
关注数
18929
内容数
1435
最新文章
爱笑的小姐姐
· 2024年07月31日
SGLang:LLM推理引擎发展新方向
21
阅读 5.3k
AI学习者
· 2024年07月22日
图解大模型计算加速系列:vLLM源码解析3,Prefix Caching
23
阅读 2.3k
AI学习者
· 2024年07月08日
窥探Triton的lower(二)
17
阅读 2.3k
爱笑的小姐姐
· 2024年07月02日
北理工提出 LTrack 双摄像头系统 | 专注于暗场景多目标跟踪,自动驾驶和夜间监控的福音!
6
阅读 4k
爱笑的小姐姐
· 2 天前
高分辨率特征+多分支交互注意力,先验增强攻克噪声模糊,3个数据集mAP全面领跑
0
阅读 209
爱笑的小姐姐
· 3 天前
DeepSeek-V3+SGLang: 推理优化
6
阅读 627
爱笑的小姐姐
· 4 天前
视觉反馈驱动+动态规则细化,7B模型性能跃升50%,碾压10倍大模型
1
阅读 515
爱笑的小姐姐
· 6 天前
TVM Relax:通过跨层次抽象实现动态 shape 的 LLM 高效部署
2
阅读 597
爱笑的小姐姐
· 4月3日
分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的技巧
3
阅读 704
爱笑的小姐姐
· 4月2日
Mobile-MMLU:专注真实端侧场景下大模型性能厮杀的 Benchmark 数据集
1
阅读 729
爱笑的小姐姐
· 4月1日
MQA/GQA/YOCO/CLA/MLKV笔记: 层内和层间KV Cache共享
1
阅读 685
爱笑的小姐姐
· 3月31日
HPCA2015:基于机器学习的 GPGPU 性能与功耗估计模型
13
阅读 1.2k
爱笑的小姐姐
· 3月28日
32B 本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
1
阅读 679
爱笑的小姐姐
· 3月28日
[张量/序列并行]图解 DeepSpeed-Ulysses & Megatron-LM TP/SP
6
阅读 636
爱笑的小姐姐
· 3月27日
LLMPerf:GPU 性能建模与大型语言模型的融合
0
阅读 818
爱笑的小姐姐
· 3月25日
Branch-Merge 蒸馏:大语言模型压缩的革命性突破
1
阅读 720
爱笑的小姐姐
· 3月24日
从零开始设计 SGLang 的 KV Cache
2
阅读 815
爱笑的小姐姐
· 3月21日
YOLO LwF 破局持续目标检测 | 自蒸馏+重放记忆双引擎,单阶段检测器告别灾难性遗忘
0
阅读 797
爱笑的小姐姐
· 3月19日
AI 能看懂细节了!IDEA 研究院多模态目标检测模型 DINO-XSeek,自然语言精准定位目标
1
阅读 877
爱笑的小姐姐
· 3月18日
轻量化+动态上采样,参数减38%、精度升4.1%,边缘设备实时部署
1
阅读 770
爱笑的小姐姐
· 3月17日
详解 vLLM 和 SGLang awq dequantize kernel 的魔法
1
阅读 717
爱笑的小姐姐
· 3月14日
从 DeepSeek MoE 专家负载均衡谈起
3
阅读 853
爱笑的小姐姐
· 3月12日
实例特定 Bottleneck+ 非对称解耦 Head,边缘设备精度突破新高度
0
阅读 830
爱笑的小姐姐
· 3月10日
SGLang MLA 实现解析
1
阅读 818
爱笑的小姐姐
· 3月7日
美团基于 SGLang 提供 INT8 无损满血版 DeepSeek R1 部署方案
11
阅读 1k
爱笑的小姐姐
· 3月6日
革新文本-图像检索,视觉 Prompt 预测+轻量训练性能超 BLIP2
1
阅读 828
爱笑的小姐姐
· 3月4日
ViT架构革新,Jumbo增强CLS Token,小模型性能涨13.5%,跨模态推理高效无损
0
阅读 1.1k
爱笑的小姐姐
· 2月28日
分析一下 EP 并行和 DeepSeek 开源的 DeepEP 代码
6
阅读 1.5k
爱笑的小姐姐
· 2月27日
可学习AttentionPredictor:实现16倍KV缓存压缩与Attention加速
1
阅读 1.1k
爱笑的小姐姐
· 2月26日
NV GPU Debug 实用指南(如何监控真实 GPU 利用率,正确判断是否重启 GPU 等)
1
阅读 892
爱笑的小姐姐
· 2月25日
苹果把台灯做成机器人!能用动作表达情绪,重新定义机器人交互
1
阅读 898
爱笑的小姐姐
· 2月24日
YOLOv12正式开源 | 中科院大学携LLM Trick让YOLO家族改头换面后依然是效率之王
8
阅读 1.6k
爱笑的小姐姐
· 2月21日
MicroViT革新轻量视觉Transformer:3.6倍速+40%能效提升,突破边缘部署极限
0
阅读 537
爱笑的小姐姐
· 2月18日
碾压YOLO系 | Fast-COS横扫BDD100K/TJU双冠,边缘端实时推理,效率起飞
4
阅读 1k
上一页
1
2
3
4
5
…
下一页
专栏作者
爱笑的小姐姐
7725 声望 · 18979 粉丝
AI学习者
11439 声望 · 12335 粉丝
棋子
13940 声望 · 4696 粉丝
下冰雹
6540 声望 · 1680 粉丝
小白会长
60 声望 · 0 粉丝
Jack-Cui
370 声望 · 4 粉丝
Xiaohang
80 声望 · 3 粉丝
云鹤
605 声望 · 1862 粉丝
nihui
620 声望 · 21 粉丝
AI老铁
2100 声望 · 898 粉丝
黎明灰烬
285 声望 · 2 粉丝
张新栋
1625 声望 · 12 粉丝
Rocky X
755 声望 · 2 粉丝
圈圈虫
777 声望 · 32 粉丝
梁德澎
755 声望 · 14 粉丝
派大星
2680 声望 · 18 粉丝
Hanson
110 声望 · 8 粉丝
杨二凯
1508 声望 · 29 粉丝
极术小姐姐
64602 声望 · 60154 粉丝
JackLi
2384 声望 · 40 粉丝
关注极术微信号
实时接收点赞提醒和评论通知
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
关注安谋科技招聘
实时获取安谋科技中国职位信息
用户指南
·
用户协议
·
隐私政策
关于我们
·
联系合作
粤ICP备18004469号
粤公网安备 44030502008014号
版权所有 © 2025 极术社区
由
SegmentFault
提供技术支持
友情链接
安谋科技
安创空间
开源中国
InfoQ
边缘计算社区
21IC 电子网
HarmonyOS 技术社区
电子芯吧客
CSDN
全志在线
芒果派
深度强化学习实验室
智东西