极术社区
注册
首页
AI开放平台
Top 专栏
读书
专题
问答
公开课
活动
注册 · 登录
▲
爱笑的小姐姐
9320 声望
嵌入式 AI,让AI无处不在。欢迎加入微信交流群,微信号:gg15319381845(...
展开
嵌入式 AI,让AI无处不在。欢迎加入微信交流群,微信号:gg15319381845(备注:嵌入式)
收起
关注他
关注了
7
粉丝数
19001
他的主页
他的提问
他的回答
他的文章
他的关注
他的粉丝
他的收藏
声望记录
他的专栏
嵌入式AI
1457 篇内容 · 18950 关注
Tengine-边缘AI推理框架
68 篇内容 · 3393 关注
他的文章
1
视觉反馈驱动+动态规则细化,7B模型性能跃升50%,碾压10倍大模型
2
TVM Relax:通过跨层次抽象实现动态 shape 的 LLM 高效部署
3
分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的技巧
1
Mobile-MMLU:专注真实端侧场景下大模型性能厮杀的 Benchmark 数据集
1
MQA/GQA/YOCO/CLA/MLKV笔记: 层内和层间KV Cache共享
13
HPCA2015:基于机器学习的 GPGPU 性能与功耗估计模型
1
32B 本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
6
[张量/序列并行]图解 DeepSpeed-Ulysses & Megatron-LM TP/SP
0
LLMPerf:GPU 性能建模与大型语言模型的融合
1
Branch-Merge 蒸馏:大语言模型压缩的革命性突破
2
从零开始设计 SGLang 的 KV Cache
0
YOLO LwF 破局持续目标检测 | 自蒸馏+重放记忆双引擎,单阶段检测器告别灾难性遗忘
1
AI 能看懂细节了!IDEA 研究院多模态目标检测模型 DINO-XSeek,自然语言精准定位目标
1
轻量化+动态上采样,参数减38%、精度升4.1%,边缘设备实时部署
1
详解 vLLM 和 SGLang awq dequantize kernel 的魔法
3
从 DeepSeek MoE 专家负载均衡谈起
0
实例特定 Bottleneck+ 非对称解耦 Head,边缘设备精度突破新高度
1
SGLang MLA 实现解析
11
美团基于 SGLang 提供 INT8 无损满血版 DeepSeek R1 部署方案
1
革新文本-图像检索,视觉 Prompt 预测+轻量训练性能超 BLIP2
上一页
1
2
3
4
5
…
下一页
回收站有 篇文章
认证与成就
获得 323 次点赞
2020年02月20日 加入
举报他
关注极术微信号
实时接收点赞提醒和评论通知
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
关注安谋科技招聘
实时获取安谋科技中国职位信息
用户指南
·
用户协议
·
隐私政策
关于我们
·
联系合作
粤ICP备18004469号
粤公网安备 44030502008014号
版权所有 © 2025 极术社区
由
SegmentFault
提供技术支持
友情链接
安谋科技
安创空间
开源中国
InfoQ
边缘计算社区
21IC 电子网
HarmonyOS 技术社区
电子芯吧客
CSDN
全志在线
芒果派
深度强化学习实验室
智东西