博客来源:[链接] 这里做了翻译。这篇博客主要讲了如何用 Triton 来优化 Float8 格式的矩阵乘法(GEMM)运算。文章提出了一个叫 GridQuant...
自 “Prompt 工作手册” 发布以来,我持续研究大模型能力的应用及研发方法,结合产业发展,在研发框架和模型应用上有了新的思考,并形成了...
Transformer 模型,自 2017 年由 Vaswani 等人提出以来,在自然语言处理(NLP)领域引发了革命性的变革。这一模型的核心在于其独特的自...
缩放定律(Scaling Law)为深度学习模型的设计和训练提供了理论指导,特别是在构建和训练大规模模型时,如何有效地分配有限的计算资源以...
大语言模型的指令遵循能力需要模型能够准确识别指令中的细微要求,并在输出中精确体现这些要求。现有方法通常采用偏好学习进行优化,在...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在进行时间序列分析之前,确定序列的平稳性是一个关键步骤。平稳性指的是时间序列的统计特性(如均值和方差)在时间维度上保持不变。本...
上周 MiniMax 开源了他们 4560 亿参数的 MoE 大模型,其中一个亮点是这个模型是一个 Lightning Attention 和 Softmax Attention 的混合...
在今天,我们随便出国走一走,就会惊讶于AI技术在中国有多么普及。高铁、机场可以人脸识别验票,公共场所随处可见AI安防系统,酒店里到...
近年来,在深度学习等 AI 技术的辅助下,蛋白质结构预测领域发展迅猛,2024 年 10 月份,因为 AlphaFold,DeepMind 的 Demis Hassabis、...
金融资产波动率建模在现代金融工程中具有重要地位,其应用涵盖风险管理、衍生品定价和投资组合优化等核心领域。本文着重探讨三种主流波...
联邦学习的研究最近从卷积神经网络(CNNs)转向了视觉 Transformer (ViTs),因为 ViTs 具有更优越的能力。由于 ViTs 缺乏 CNN 固有的 ...
从古至今,人类从未停止过与疾病的抗争,一款新药的出现可能挽救成千上万的生命,甚至还会延长人类的整体寿命。
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
状态空间模型通过构建生成可观测数据的潜在未观测状态模型来进行时间序列分析。作为该方法论的核心,卡尔曼滤波为实时估计这些隐状态提...
2024年,是荣耀在AI方面的收获之年,领航之年。当全球手机品牌都在将战略重心调整到AI领域的时候,荣耀已经先行一步,成为终端行业在AI...
大家喜欢在旅行中找寻美丽的风景,而对于脑极体的小伙伴们来说,旅行有着更多一重的意义,就是探寻智能化的变迁。多年以来,我们在港口...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
医疗人工智能的快速发展离不开高质量数据集的支持。从疾病诊断到药物研发,再到个性化医疗,数据集在推动机器视觉、大模型等应用于医学...
1月7日至10日,2025年国际消费类电子产品展览会(Consumer Electronics Show,简称CES 2025)在美国拉斯维加斯开展。CES自1967年开展以...
「明年我们去法国接甲骨文回家」,2024 年 12 月下旬,安阳师范学院甲骨文信息处理教育部重点实验室的研究人员远赴法国,与法国国家图书...
TSFresh(基于可扩展假设检验的时间序列特征提取)是一个专门用于时间序列数据特征自动提取的框架。该框架提取的特征可直接应用于分类、...
细小物体由于其有限的空间分辨率,往往呈现出点状分布的特点。因此,使用点级监督进行边界框预测自然且成本效益高,成为传统框级监督的...
蛋白质作为生命的「工作分子」,其结构与功能研究需要耗费大量时间与资源,但 AI 技术的引入彻底改变了这一局面。通过深度学习模型,研...
深度学习模型因其复杂的网络结构与强烈的“黑箱”特性,使得AI开发者在处理海量非结构化数据时如同穿越一片汹涌澎湃的未知海洋。
一句话总结2024年大模型的商业化进展,或许是冰火两重天。一方面,我们看到了许多成功的AI付费用例,小到9.9一套的AIGC宠物写真,200美...
Coconut(连续思维链)提出了一种新的大语言模型推理范式,该范式在潜在空间中进行运算,利用模型隐藏层生成的连续思维状态取代传统的基...
在中国,自古就有“食在广东”的说法,而在广东深圳坪山,如果你问本地男女老少,哪里的筵席最好,大概率会听到一个名字:骏群。
博客来源:[链接] 这里做了个翻译。这篇 PyTorch 的 blog 简要介绍了 CUTLASS 中的 Ping-Pong GEMM kernel 设计,它是专门为 Hopper GPU...
当今,医疗资源紧张是困扰全球医疗系统的长期性问题,「医生荒」在基础保健和全科医学领域尤为突出。世界卫生组织预计,到 2030 年,全...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在现代数据分析领域,时间序列数据的处理和预测一直是一个具有挑战性的问题。随着物联网设备、金融交易系统和工业传感器的普及,我们面...
「Meet AI4S」系列直播第 6 期将于 1 月 15 日 19:00 准时开播,HyperAI超神经有幸邀请到了南开大学统计与数据科学学院教授郑伟,他本次...
自 2004 年开源发布以来,LAMMPS 在材料建模领域得到了广泛应用,其全称为 Large-scale Atomic/Molecular Massively Parallel Simulator...
Aeon 是一个专注于时间序列处理的开源 Python 库,其设计理念遵循 scikit-learn 的 API 风格,为数据科学家和研究人员提供了一套完整的...