大语言模型(LLM)通过其参数储存了大量信息,这些信息主要以密集层中线性矩阵变换的权重形式存在。然而,参数规模的扩大必然导致计算成...
过去的一年,多模态大模型不断给行业带来惊喜,随着生成式AI和大模型技术加速破圈,算力进入“建设为王”的新时代。
前两天,月之暗面推出了Kimi k1.5多模态思考模型,DeepSeek也发布了DeepSeek-R1文本推理模型,二者都在推理能力上对标OpenAI正式版o1。
今天(1 月 22 日)凌晨,在白宫新闻发布会上,OpenAI CEO Sam Altman、软银 CEO 孙正义、甲骨文 (Oracle) CEO Larry Ellison 与特朗普...
2019 年 12 月,新冠疫情 (COVID-19) 突然爆发,这种由 SARS-CoV-2 病毒引起的疾病具有高度传染性,仅一个月时间,我国病例涉及人数就超...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在进行时间序列分析之前,确定序列的平稳性是一个关键步骤。平稳性指的是时间序列的统计特性(如均值和方差)在时间维度上保持不变。本...
上周 MiniMax 开源了他们 4560 亿参数的 MoE 大模型,其中一个亮点是这个模型是一个 Lightning Attention 和 Softmax Attention 的混合...
在今天,我们随便出国走一走,就会惊讶于AI技术在中国有多么普及。高铁、机场可以人脸识别验票,公共场所随处可见AI安防系统,酒店里到...
近年来,在深度学习等 AI 技术的辅助下,蛋白质结构预测领域发展迅猛,2024 年 10 月份,因为 AlphaFold,DeepMind 的 Demis Hassabis、...
金融资产波动率建模在现代金融工程中具有重要地位,其应用涵盖风险管理、衍生品定价和投资组合优化等核心领域。本文着重探讨三种主流波...
联邦学习的研究最近从卷积神经网络(CNNs)转向了视觉 Transformer (ViTs),因为 ViTs 具有更优越的能力。由于 ViTs 缺乏 CNN 固有的 ...
从古至今,人类从未停止过与疾病的抗争,一款新药的出现可能挽救成千上万的生命,甚至还会延长人类的整体寿命。
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
状态空间模型通过构建生成可观测数据的潜在未观测状态模型来进行时间序列分析。作为该方法论的核心,卡尔曼滤波为实时估计这些隐状态提...
博客来源:[链接] 这里做了翻译。这篇博客主要讲了如何用 Triton 来优化 Float8 格式的矩阵乘法(GEMM)运算。文章提出了一个叫 GridQuant...
2024年,是荣耀在AI方面的收获之年,领航之年。当全球手机品牌都在将战略重心调整到AI领域的时候,荣耀已经先行一步,成为终端行业在AI...
大家喜欢在旅行中找寻美丽的风景,而对于脑极体的小伙伴们来说,旅行有着更多一重的意义,就是探寻智能化的变迁。多年以来,我们在港口...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
医疗人工智能的快速发展离不开高质量数据集的支持。从疾病诊断到药物研发,再到个性化医疗,数据集在推动机器视觉、大模型等应用于医学...
1月7日至10日,2025年国际消费类电子产品展览会(Consumer Electronics Show,简称CES 2025)在美国拉斯维加斯开展。CES自1967年开展以...
「明年我们去法国接甲骨文回家」,2024 年 12 月下旬,安阳师范学院甲骨文信息处理教育部重点实验室的研究人员远赴法国,与法国国家图书...
TSFresh(基于可扩展假设检验的时间序列特征提取)是一个专门用于时间序列数据特征自动提取的框架。该框架提取的特征可直接应用于分类、...
自 “Prompt 工作手册” 发布以来,我持续研究大模型能力的应用及研发方法,结合产业发展,在研发框架和模型应用上有了新的思考,并形成了...
细小物体由于其有限的空间分辨率,往往呈现出点状分布的特点。因此,使用点级监督进行边界框预测自然且成本效益高,成为传统框级监督的...
大语言模型(LLM)通过其参数储存了大量信息,这些信息主要以密集层中线性矩阵变换的权重形式存在。然而,参数规模的扩大必然导致计算成...
过去的一年,多模态大模型不断给行业带来惊喜,随着生成式AI和大模型技术加速破圈,算力进入“建设为王”的新时代。
前两天,月之暗面推出了Kimi k1.5多模态思考模型,DeepSeek也发布了DeepSeek-R1文本推理模型,二者都在推理能力上对标OpenAI正式版o1。
今天(1 月 22 日)凌晨,在白宫新闻发布会上,OpenAI CEO Sam Altman、软银 CEO 孙正义、甲骨文 (Oracle) CEO Larry Ellison 与特朗普...
2019 年 12 月,新冠疫情 (COVID-19) 突然爆发,这种由 SARS-CoV-2 病毒引起的疾病具有高度传染性,仅一个月时间,我国病例涉及人数就超...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在进行时间序列分析之前,确定序列的平稳性是一个关键步骤。平稳性指的是时间序列的统计特性(如均值和方差)在时间维度上保持不变。本...
上周 MiniMax 开源了他们 4560 亿参数的 MoE 大模型,其中一个亮点是这个模型是一个 Lightning Attention 和 Softmax Attention 的混合...
在今天,我们随便出国走一走,就会惊讶于AI技术在中国有多么普及。高铁、机场可以人脸识别验票,公共场所随处可见AI安防系统,酒店里到...
近年来,在深度学习等 AI 技术的辅助下,蛋白质结构预测领域发展迅猛,2024 年 10 月份,因为 AlphaFold,DeepMind 的 Demis Hassabis、...
金融资产波动率建模在现代金融工程中具有重要地位,其应用涵盖风险管理、衍生品定价和投资组合优化等核心领域。本文着重探讨三种主流波...
联邦学习的研究最近从卷积神经网络(CNNs)转向了视觉 Transformer (ViTs),因为 ViTs 具有更优越的能力。由于 ViTs 缺乏 CNN 固有的 ...
从古至今,人类从未停止过与疾病的抗争,一款新药的出现可能挽救成千上万的生命,甚至还会延长人类的整体寿命。
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
状态空间模型通过构建生成可观测数据的潜在未观测状态模型来进行时间序列分析。作为该方法论的核心,卡尔曼滤波为实时估计这些隐状态提...
博客来源:[链接] 这里做了翻译。这篇博客主要讲了如何用 Triton 来优化 Float8 格式的矩阵乘法(GEMM)运算。文章提出了一个叫 GridQuant...
2024年,是荣耀在AI方面的收获之年,领航之年。当全球手机品牌都在将战略重心调整到AI领域的时候,荣耀已经先行一步,成为终端行业在AI...
大家喜欢在旅行中找寻美丽的风景,而对于脑极体的小伙伴们来说,旅行有着更多一重的意义,就是探寻智能化的变迁。多年以来,我们在港口...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
医疗人工智能的快速发展离不开高质量数据集的支持。从疾病诊断到药物研发,再到个性化医疗,数据集在推动机器视觉、大模型等应用于医学...
1月7日至10日,2025年国际消费类电子产品展览会(Consumer Electronics Show,简称CES 2025)在美国拉斯维加斯开展。CES自1967年开展以...
「明年我们去法国接甲骨文回家」,2024 年 12 月下旬,安阳师范学院甲骨文信息处理教育部重点实验室的研究人员远赴法国,与法国国家图书...
TSFresh(基于可扩展假设检验的时间序列特征提取)是一个专门用于时间序列数据特征自动提取的框架。该框架提取的特征可直接应用于分类、...
自 “Prompt 工作手册” 发布以来,我持续研究大模型能力的应用及研发方法,结合产业发展,在研发框架和模型应用上有了新的思考,并形成了...
细小物体由于其有限的空间分辨率,往往呈现出点状分布的特点。因此,使用点级监督进行边界框预测自然且成本效益高,成为传统框级监督的...