大模型下最新的文章 - 极术社区 - 连接开发者与智能计算生态

大模型

ChatGPT，文心一言等大模型技术及应用

关注标签

关注数

0

内容数

644

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

腾讯技术工程 · 6月10日

MCP很好，但它不是万灵药！真正的技术进步，往往始于祛魅之后的清醒认知

人人都在聊MCP，但人们口中的MCP往往只是一个拼凑而成的幻影。如今，各大厂商纷纷为它镀金包装，就像硅谷创投圈每隔几年就热炒一次的那...

2 阅读 660
爱笑的小姐姐 · 6月9日

Meta Shuffling 的 MoE Grouped GEMM kernel benchmark

紧接着昨天那篇PyTorch Blog的内容MetaShuffling：Meta的Fused MoE kernel工程方案，更激进的Kernel优化和尽量避免Padding，我把fbgemm...

1 阅读 1.1k
AI学习者 · 6月6日

MetaShuffling：Meta 激进优化 Fused MoE kernel，规避Padding

By Shikai Li, Gefei Zuo, Jianyu Huang, Jason Park, Zoey Sun, Xiaozhu Meng, Xiaodong Wang, Hongtao Yu, Changkyu Kim, CQ Tang, St...

0 阅读 672
科技云报到 · 6月5日

科技云报到：瞄准企业级智能体，艺赛旗加速业务出海重塑数智生产力

过去十年，“中国制造”的标签逐渐被“中国智造”取代；未来十年，中国智能技术将更加深度的融入全球产业链，成为全球技术生态的关键变量。

1 阅读 622
爱笑的小姐姐 · 6月5日

Soft 最近邻插值 SNI 对齐特征 +ESD 增强空间保留，效率精度双突破

特征错位问题：传统 FPN 类范式在多尺度检测中通过逐点融合不同层级的特征图，容易导致特征错位问题，从而影响模型性能。

0 阅读 1.5k
NVIDIA英伟达嵌入式系统 · 6月5日

NVIDIA 研究中心的突破性研究进一步提升机器人的运动能力

在亚特兰大举行的国际机器人与自动化大会 (ICRA) 上，NVIDIA 展示了其在生成式 AI、仿真和自主操控领域的多项研究成果。

0 阅读 691
爱笑的小姐姐 · 6月4日

图解Vllm V1系列4：加载模型权重(load_model)

按照原定计划，这篇文章应该要开始进入Scheduler的讲解了。但是我突然想起，在之前的文章中，漏掉了一个看似简单，但是十分重要的细节：...

1 阅读 718
天罡智算杨旭颖 · 6月4日

万亿数字经济背后的算力跃迁:爆发式增长、深度渗透与中小企业困境

摘要:中国数字经济规模十年增长3.8倍，2023年达53.9万亿元，占42.8%,贡献率66.45%。智能算力作为关键引擎,市场规模跃升至每1元投入带动3...

0 阅读 3.5k
超神经HyperAI · 5月30日

一键部署丨DeepSeek-R1 新版本小幅升级便登顶开源王座，多项评测超越 Qwen3

近日，DeepSeek 官宣其 R1 模型进行「小幅」版本升级，发布 DeepSeek-R1-0528 。在此次更新中，DeepSeek R1 通过提升计算资源配置并在后...

1 阅读 640
zhangxiaolong · 5月30日

为“星睿O6”AI PC开发套件打造端到端AI-HIFI软硬件系统（立flag~）

拿到Cix开发有一阵子了，写了一篇NPU的测评文章，链接在这：跳跳跳，发现大家好像对枯燥的技术性文章热情不高：

50 阅读 3k
派大星 · 5月30日

用大模型实现 VHDL 代码解释、生成与优化，加速高性能微处理器设计！

关键词：LLM 定制，RTL 设计，VHDL 设计，LLM as a Judge，高性能处理器设计生产力

4 阅读 1.6k
超神经HyperAI · 5月29日

内含教程丨微软Aurora计算速度提升5000倍，可预测极端天气/空气质量/海浪/气旋路径等

随着全球气候变化和自然灾害频发，精确可靠的地球系统预测对于减轻灾害影响、支持人类社会进步都至关重要。传统的数值模型虽然功能强大...

0 阅读 846
NVIDIA英伟达嵌入式系统 · 5月29日

R²D²：通过 NVIDIA 研究中心的工作流，实现机器人装配和接触密集型操作

这篇文章是“NVIDIA 机器人研究与开发摘要 (R²D²)”的一部分，旨在让开发者更深入地了解 NVIDIA 研究中心在物理 AI 和机器人应用方面的最...

0 阅读 764
爱笑的小姐姐 · 5月29日

MiniMax AI 开源首个感知+推理的强化学习框架 V-Triune: 统一视觉-语言任务

随着 DeepSeek-R1 的火爆出圈，LLMs 和 VLMs 俨然已从 pretrain 转变为 test-time scaling 范式，从而促使 CoT Reasoning 愈演愈烈。今...

0 阅读 1.7k
超神经HyperAI · 5月28日

华中科技大学提出融合策略 AI 模型，实现多中心、跨专科感染性休克死亡风险的精准预测

感染性休克（又称脓毒性休克）是指由脓毒症引发的严重循环障碍和细胞代谢紊乱的综合征，在临床表现上可以视为脓毒症发展的「终末阶段」...

0 阅读 764
腾讯技术工程 · 5月28日

MCP 技术浪潮中的 Agent 应用开发新范式

当下，随着 MCP（模型上下文协议）的迅速发展，AI 开发领域的协作生态正经历重塑，MCP 为应用和服务方之间的协同开辟了新途径。太极平台...

1 阅读 1k
爱笑的小姐姐 · 5月28日

边缘端Qwen2.5-0.5B推理：通过模型压缩和硬件加速实现高效的LLM推理

基于 Transformer 的大型语言模型（LLMs）显著推动了人工智能能力的发展，但由于其高计算需求、内存带宽限制和能耗问题，将其部署在边缘...

1 阅读 1.5k
爱笑的小姐姐 · 5月27日

YOPOv2-Tracker开源 | 端到端方法革新，跟踪提速10倍，扰动观测器破解传统框架延迟难题

高效目标跟踪：在杂乱环境中实现对不可预测目标的高效跟踪，解决传统分离流程引入的显著延迟和累积误差问题。

0 阅读 1k
爱笑的小姐姐 · 5月26日

[Triton编程][基础] Triton极简入门: Triton Vector Add

后续会陆续更新一些CUDA和Triton Kernel编程入门向的文章，虽然比较浅显简单，但我自己挺喜欢这种温故而知新的感觉。

4 阅读 887
AI学习者 · 5月22日

2.6 倍加速，能耗降 1.4 倍！量化算法与硬件协同设计混合精度 GEMM 加速器 MixPE

关键词：SW HW Co-design、mpGEMM、LLM、Inference、Quantization

2 阅读 1.1k

上一页
1
2
3
4
5
…
下一页

本月贡献榜

极术直播小助手

贡献 90 声望

zhangxiaolong

贡献 65 声望

超神经HyperAI

贡献 15 声望

李隆

贡献 10 声望

风过

贡献 5 声望

陈军

贡献 5 声望

Vehicle 公众号

贡献 5 声望

E企研究院

贡献 5 声望

AI学习者

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息