极术社区
注册
首页
AI开放平台
Top 专栏
读书
专题
问答
公开课
活动
注册 · 登录
▲
嵌入式AI
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
关注专栏
管理
关注数
18962
内容数
1471
最新文章
爱笑的小姐姐
· 2024年07月31日
SGLang:LLM推理引擎发展新方向
22
阅读 5.9k
AI学习者
· 2024年07月22日
图解大模型计算加速系列:vLLM源码解析3,Prefix Caching
24
阅读 2.6k
AI学习者
· 2024年07月08日
窥探Triton的lower(二)
17
阅读 2.5k
爱笑的小姐姐
· 2024年07月02日
北理工提出 LTrack 双摄像头系统 | 专注于暗场景多目标跟踪,自动驾驶和夜间监控的福音!
6
阅读 4.1k
爱笑的小姐姐
· 21 小时前
边缘端Qwen2.5-0.5B推理:通过模型压缩和硬件加速实现高效的LLM推理
0
阅读 236
AI学习者
· 21 小时前
嵌入式UI布局之状态栏与自适应屏幕尺寸
0
阅读 121
爱笑的小姐姐
· 1 天前
YOPOv2-Tracker开源 | 端到端方法革新,跟踪提速10倍,扰动观测器破解传统框架延迟难题
0
阅读 310
爱笑的小姐姐
· 2 天前
[Triton编程][基础] Triton极简入门: Triton Vector Add
3
阅读 376
爱笑的小姐姐
· 5 天前
VisionReasoner首提统一框架,检测/分割/计数3类任务超越YOLO-World等专用模型
0
阅读 591
AI学习者
· 6 天前
2.6 倍加速,能耗降 1.4 倍!量化算法与硬件协同设计混合精度 GEMM 加速器 MixPE
2
阅读 798
爱笑的小姐姐
· 5月21日
混合CPU-GPU调度+Cache管理:MoE推理Prefill1.3倍、Decode1.7倍加速!
0
阅读 586
AI学习者
· 5月20日
SAM突破多模态分割 | SAM2+语义记忆模块,实现跨模态语义理解登顶DELIVER
0
阅读 674
爱笑的小姐姐
· 5月19日
CMU与Meta提出LithOS:节省 GPU51% 容量、26%能耗,迈向高效机器学习操作系统
1
阅读 517
AI学习者
· 5月16日
单机H200最快DeepSeek V3和R1推理系统优化秘籍
0
阅读 710
爱笑的小姐姐
· 5月15日
SGLang 源码学习笔记:Cache、Req与Scheduler
2
阅读 754
爱笑的小姐姐
· 5月14日
基于 LLM 的 RTL 代码生成,VerilogEval 上功能正确性 SOTA
0
阅读 1.3k
爱笑的小姐姐
· 5月13日
在多模态的浪潮之巅,如何“精雕细琢”图文对齐?
0
阅读 833
爱笑的小姐姐
· 5月12日
Tilus 虚拟机:超越 Triton 开启低精度任意比特 GPGPU 的 LLM 高效计算
1
阅读 226
爱笑的小姐姐
· 5月9日
FlashInfer:面向 LLM 服务的可定制且高效的 GPU 注意力引擎
2
阅读 1.1k
爱笑的小姐姐
· 5月8日
FP4DiT:扩散 Transformer 模型 FP4 量化的革命性突破,开启边缘部署新时代
0
阅读 281
爱笑的小姐姐
· 5月7日
在 96 个 H100 GPU 上部署具有 PD 分解和大规模专家并行性的 DeepSeek
1
阅读 1k
爱笑的小姐姐
· 5月6日
在 SGLang 中实现 Flash Attention 后端 - 基础和 KV 缓存
0
阅读 989
爱笑的小姐姐
· 4月30日
3.5 倍能效突破,Attention 和 Softmax 的 AI 加速器实现
0
阅读 789
下冰雹
· 4月29日
Qwen3:思深,行速
2
阅读 796
AI学习者
· 4月29日
猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火
18
阅读 895
爱笑的小姐姐
· 4月29日
EdgeLLM:数据并行、端到端编译器与混合精度的 CPU-FPGA 加速架构
0
阅读 655
爱笑的小姐姐
· 4月28日
图解 Vllm V1 系列 1:整体流程
2
阅读 698
爱笑的小姐姐
· 4月27日
工业异常检测新范式,自Prompt+多块特征聚合,Mask精准定位小缺陷,双基准性能领跑
1
阅读 655
爱笑的小姐姐
· 4月25日
ML-Triton:Intel 在 Triton GPU 编程的多级编译与语言扩展的工作
1
阅读 1.5k
AI学习者
· 4月24日
使用机器学习与深度学习技术的编译器优化调研
1
阅读 631
爱笑的小姐姐
· 4月24日
MobilePlantViT 破局边缘 AI | 0.69M 超轻混合 ViT 实现 99% 分类
1
阅读 606
爱笑的小姐姐
· 4月23日
Paddle-MLIR:编译时间减少 20%!边缘智能设备 AI 加速的革命性突破
1
阅读 660
爱笑的小姐姐
· 4月22日
一起聊聊 Nvidia Hopper 新特性之计算切分
2
阅读 559
爱笑的小姐姐
· 4月21日
为二值神经网络扩展 NPU 二值 GEMM 核心功能单元和编译器
10
阅读 331
上一页
1
2
3
4
5
…
下一页
专栏作者
爱笑的小姐姐
7725 声望 · 19014 粉丝
AI学习者
11579 声望 · 12922 粉丝
棋子
13940 声望 · 4702 粉丝
下冰雹
6540 声望 · 1680 粉丝
小白会长
60 声望 · 0 粉丝
Jack-Cui
370 声望 · 4 粉丝
Xiaohang
80 声望 · 3 粉丝
云鹤
605 声望 · 1864 粉丝
nihui
875 声望 · 21 粉丝
AI老铁
2100 声望 · 899 粉丝
黎明灰烬
285 声望 · 2 粉丝
张新栋
1625 声望 · 12 粉丝
Rocky X
755 声望 · 2 粉丝
圈圈虫
777 声望 · 32 粉丝
梁德澎
755 声望 · 14 粉丝
派大星
2680 声望 · 18 粉丝
Hanson
110 声望 · 8 粉丝
杨二凯
1508 声望 · 29 粉丝
极术小姐姐
64602 声望 · 60190 粉丝
JackLi
2384 声望 · 40 粉丝
关注极术微信号
实时接收点赞提醒和评论通知
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
关注安谋科技招聘
实时获取安谋科技中国职位信息
用户指南
·
用户协议
·
隐私政策
关于我们
·
联系合作
粤ICP备18004469号
粤公网安备 44030502008014号
版权所有 © 2025 极术社区
由
SegmentFault
提供技术支持
友情链接
安谋科技
安创空间
开源中国
InfoQ
边缘计算社区
21IC 电子网
HarmonyOS 技术社区
电子芯吧客
CSDN
全志在线
芒果派
深度强化学习实验室
智东西