YOLO (You Only Look Once) 是计算机视觉领域中最具影响力的实时目标检测算法之一,以其高精度与高效性深受业界青睐,广泛应用于自动驾...
2024 年,AI 浪潮依旧凶猛地奔涌向前,未见颓势,悄然重塑着世界的轮廓,书写了一个个创纪录的革新性事件。
新年新目标,阅读伴成长2025 年的第一本书你选好了吗?HyperAI超神经精选了 10 本 AI 领域必读书籍用知识武装自己,在新的一年跑得更远吧!
正月初三,年味正浓。新春的喜庆氛围不仅弥漫在大街小巷,也在人工智能领域引发了诸多创新应用。从 AI 生成春联,到春运交通标志的智能...
DeepSeek-R1 通过创新的训练策略实现了显著的成本降低,同时保持了卓越的模型性能。本文将详细分析其核心训练方法。
中国摘要随着全球工业生产的迅速发展,对电力设备可靠性的需求不断提高。确保电力系统运行的稳定性需要准确的方法来检测电力设备中的潜...
2025年初,大模型赛场热度不减,有拼成本优势,拼Tokens调用量的短跑赛;有比慢思考,比大模型推理能力的长跑赛。但在观看这些“经典赛事...
Apache TVM是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
除夕是农历年的最后一天,在这个旧岁新年更替之际,人们往往会通过贴春联、挂灯笼等活动来祈福并正式开启「春节模式」。春联也称为「对...
知识蒸馏是一种通过性能与模型规模的权衡来实现模型压缩的技术。其核心思想是将较大规模模型(称为教师模型)中的知识迁移到规模较小的...
快过年了,大家是否和我一样,跟家乡的关系弱了,归家途中“近乡情更怯”,担心大过年的把天给聊尬了。但踏上故土的那一刻,听到熟悉的乡...
以 AlphaFold 为代表的 AI 系统,能够以前所未有的精度预测蛋白质三维结构,为理解蛋白质功能和开发靶向药物提供了革命性工具。在药物研...
过去几年,以英伟达、谷歌为首的科技巨头纷纷表达对 AI 医疗的重视,近千亿元资金被砸进该赛道,医疗领域也成为 AI 应用最广、成效最明...
AI for Science 作为科学发现的「第五范式」, 正在开创一场全新的科研革命,在材料化学领域,这场变革尤为显著。
在性能要求较高的应用场景中,Python 常因其执行速度不及 C、C++或 Rust 等编译型语言而受到质疑。然而通过合理运用 Python 标准库提供...
近年来,人工智能的快速发展正以前所未有的深度和广度影响着科学研究的各个领域。作为推动科技进步的重要引擎之一,「AI for Science」...
yifuwang 在 [链接] 中实现了一个 triton_all_gather_matmul.py ,也就是可以把 AllGather 和 MatMul kernel fuse 起来变成一个 kernel...
在 1 月初的 CES 2025 大会上,黄仁勋身着新款皮衣为大家带来了多重惊喜,除了「世界最快GPU RTX 5090」之外,世界基础模型 Cosmos 也引...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
大型语言模型(LLMs)在处理复杂推理任务时面临挑战,这突显了其在模拟人类认知中的不足。尽管 LLMs 擅长生成连贯文本和解决简单问题,...
一、写在前面在 OpenAI o1 刚放出来时,它有限的技术报告里,有 2 个内容格外抓人眼球:Inference/test-time scalingRL我一直是把这 2 ...
不知道大家对这句话感受如何,作为科技博主的我,经常心有戚戚。这些年来,我似乎见证了太多堪称历史性的变革,AI技术从无人问津到街谈...
2023 年 12 月,谷歌 DeepMind 在「Nature」上发布其在材料化学领域的深度学习模型 GNoME,宣称发现了 220 万种新的无机材料的晶体结构...
大语言模型(LLM)通过其参数储存了大量信息,这些信息主要以密集层中线性矩阵变换的权重形式存在。然而,参数规模的扩大必然导致计算成...
过去的一年,多模态大模型不断给行业带来惊喜,随着生成式AI和大模型技术加速破圈,算力进入“建设为王”的新时代。
前两天,月之暗面推出了Kimi k1.5多模态思考模型,DeepSeek也发布了DeepSeek-R1文本推理模型,二者都在推理能力上对标OpenAI正式版o1。
今天(1 月 22 日)凌晨,在白宫新闻发布会上,OpenAI CEO Sam Altman、软银 CEO 孙正义、甲骨文 (Oracle) CEO Larry Ellison 与特朗普...
2019 年 12 月,新冠疫情 (COVID-19) 突然爆发,这种由 SARS-CoV-2 病毒引起的疾病具有高度传染性,仅一个月时间,我国病例涉及人数就超...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在进行时间序列分析之前,确定序列的平稳性是一个关键步骤。平稳性指的是时间序列的统计特性(如均值和方差)在时间维度上保持不变。本...