极术社区
注册
首页
AI开放平台
Top 专栏
读书
专题
问答
公开课
活动
注册 · 登录
▲
嵌入式AI
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
关注专栏
管理
关注数
18983
内容数
1493
最新文章
爱笑的小姐姐
· 2024年07月31日
SGLang:LLM推理引擎发展新方向
23
阅读 6.3k
AI学习者
· 2024年07月22日
图解大模型计算加速系列:vLLM源码解析3,Prefix Caching
25
阅读 2.8k
AI学习者
· 2024年07月08日
窥探Triton的lower(二)
18
阅读 2.7k
爱笑的小姐姐
· 2024年07月02日
北理工提出 LTrack 双摄像头系统 | 专注于暗场景多目标跟踪,自动驾驶和夜间监控的福音!
7
阅读 4.3k
AI学习者
· 6月30日
微小目标检测新标杆 | DPNet首创动态神经网络范式,微小目标检测效率跃升35%!
0
阅读 1k
AI学习者
· 6月27日
CLIP进化论 | 16亿长文本训练,细粒度识别性能碾压原版CLIP 21.6%
0
阅读 905
爱笑的小姐姐
· 6月26日
HMPE革新Transformer检测,小目标mAP飙升1.9%,解码器砍掉5层,推理速度翻倍
0
阅读 1k
爱笑的小姐姐
· 6月25日
YOLOv13震撼发布 | 超图高阶建模+轻量化模块,保证实时性的情况下,检测精度再创新高!
1
阅读 1.4k
AI学习者
· 6月24日
学习用于通用代码优化的编译器世界模型,超越内置编译器优化标志和最先进方法!
0
阅读 662
AI学习者
· 6月23日
小目标检测新标杆,SimAM无参数注意力+NWD指标完胜YOLOv7
1
阅读 772
爱笑的小姐姐
· 6月20日
HeteroLLM:利用移动端 SoC 实现 NPU-GPU 并行异构 LLM 推理!
1
阅读 866
AI学习者
· 6月19日
图解Vllm V1系列6:KVCacheManager与PrefixCaching
0
阅读 640
AI学习者
· 6月18日
【博客转载】C++/CUDA Data Alignment
1
阅读 450
爱笑的小姐姐
· 6月17日
【博客转载】CUDA Kernel Execution Overlap
0
阅读 774
AI学习者
· 6月16日
GigaTok借语义正则化统一视觉分词器,3B参数完胜VQ-GAN,刷新ImageNet纪录
0
阅读 634
AI学习者
· 6月13日
vLLM Triton Merge Attention States Kernel详解
0
阅读 689
AI学习者
· 6月12日
图解Vllm V1系列5:调度器策略(Scheduler)
0
阅读 745
AI学习者
· 6月11日
汇编级NVIDIA与AMD GPU代码转换新SOTA!跨架构方案CASS开源,性能超商业基线
0
阅读 531
AI学习者
· 6月10日
MGIoU革命 | 统一损失函数高效优化任意凸形状,计算延迟锐减40倍超越KFIoU
1
阅读 586
爱笑的小姐姐
· 6月9日
Meta Shuffling 的 MoE Grouped GEMM kernel benchmark
1
阅读 1k
AI学习者
· 6月6日
MetaShuffling:Meta 激进优化 Fused MoE kernel,规避Padding
0
阅读 662
爱笑的小姐姐
· 6月5日
Soft 最近邻插值 SNI 对齐特征 +ESD 增强空间保留,效率精度双突破
0
阅读 1.4k
爱笑的小姐姐
· 6月4日
图解Vllm V1系列4:加载模型权重(load_model)
1
阅读 705
爱笑的小姐姐
· 6月3日
减少 55% 代码行数、 CPU 和 GPU 峰值内存,加速训练推理!
4
阅读 844
派大星
· 5月30日
用大模型实现 VHDL 代码解释、生成与优化,加速高性能微处理器设计!
4
阅读 1.6k
爱笑的小姐姐
· 5月29日
MiniMax AI 开源首个感知+推理的强化学习框架 V-Triune: 统一视觉-语言任务
0
阅读 1.6k
爱笑的小姐姐
· 5月28日
边缘端Qwen2.5-0.5B推理:通过模型压缩和硬件加速实现高效的LLM推理
1
阅读 1.5k
AI学习者
· 5月28日
嵌入式UI布局之状态栏与自适应屏幕尺寸
1
阅读 1.5k
爱笑的小姐姐
· 5月27日
YOPOv2-Tracker开源 | 端到端方法革新,跟踪提速10倍,扰动观测器破解传统框架延迟难题
0
阅读 990
爱笑的小姐姐
· 5月26日
[Triton编程][基础] Triton极简入门: Triton Vector Add
4
阅读 869
爱笑的小姐姐
· 5月23日
VisionReasoner首提统一框架,检测/分割/计数3类任务超越YOLO-World等专用模型
0
阅读 865
AI学习者
· 5月22日
2.6 倍加速,能耗降 1.4 倍!量化算法与硬件协同设计混合精度 GEMM 加速器 MixPE
2
阅读 1.1k
爱笑的小姐姐
· 5月21日
混合CPU-GPU调度+Cache管理:MoE推理Prefill1.3倍、Decode1.7倍加速!
0
阅读 1.1k
AI学习者
· 5月20日
SAM突破多模态分割 | SAM2+语义记忆模块,实现跨模态语义理解登顶DELIVER
0
阅读 844
上一页
1
2
3
4
5
…
下一页
专栏作者
爱笑的小姐姐
7725 声望 · 19036 粉丝
AI学习者
11624 声望 · 12921 粉丝
棋子
13940 声望 · 4708 粉丝
下冰雹
6540 声望 · 1683 粉丝
小白会长
60 声望 · 0 粉丝
Jack-Cui
370 声望 · 4 粉丝
Xiaohang
80 声望 · 3 粉丝
云鹤
605 声望 · 1864 粉丝
nihui
875 声望 · 21 粉丝
AI老铁
2100 声望 · 903 粉丝
黎明灰烬
285 声望 · 2 粉丝
张新栋
1625 声望 · 12 粉丝
Rocky X
755 声望 · 2 粉丝
圈圈虫
777 声望 · 32 粉丝
梁德澎
755 声望 · 14 粉丝
派大星
2680 声望 · 18 粉丝
Hanson
110 声望 · 8 粉丝
杨二凯
1508 声望 · 29 粉丝
极术小姐姐
64602 声望 · 60225 粉丝
JackLi
2384 声望 · 40 粉丝
关注极术微信号
实时接收点赞提醒和评论通知
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
关注安谋科技招聘
实时获取安谋科技中国职位信息
用户指南
·
用户协议
·
隐私政策
关于我们
·
联系合作
粤ICP备18004469号
粤公网安备 44030502008014号
版权所有 © 2025 极术社区
由
SegmentFault
提供技术支持
友情链接
安谋科技
安创空间
开源中国
InfoQ
边缘计算社区
21IC 电子网
HarmonyOS 技术社区
电子芯吧客
CSDN
全志在线
芒果派
深度强化学习实验室
智东西