近年来,随着几部悬疑、犯罪类题材的影视剧叫好卖座,一个充满神秘色彩的学科也被带到了观众面前——法医学。简单来说,法医学就如同隐藏...
DeepSeek R1 的完整训练流程核心在于,在其基础模型 DeepSeek V3 之上,运用了多种强化学习策略。本文将从一个可本地运行的基础模型起步...
DeepSeek 开源引发的全球热潮余温尚在,近日,阶跃星辰携手吉利汽车集团再度出手,强势开源了 Step-Audio-TTS-3B 模型,再次引发了业内...
指标收集是每个机器学习项目不可或缺的组成部分,它使我们能够跟踪模型性能并监控训练进度。理想情况下,我们希望在不给训练过程带来额...
2023 年 11 月,美国劳伦斯伯克利国家实验室的科学家们围着一台机械臂屏息凝神——这个名为 A-Lab 的 AI 材料合成平台刚刚在连续成功制备 ...
近端策略优化(Proximal Policy Optimization, PPO)算法作为一种高效的策略优化方法,在深度强化学习领域获得了广泛应用。特别是在大语言...
本文系统性地阐述了大型语言模型(Large Language Models, LLMs)中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制...
相信很多喜爱漫威电影的朋友都曾被这一幕所惊艳,在电影「钢铁侠 2」中,人工智能管家贾维斯通过采集斯塔克的血液样本,利用深度学习算...
2021 年,OpenAI 发布了革命性的 CLIP (Contrastive Language-ImagePre-training) 模型——通过无监督学习的方式,CLIP 在不需要额外标注...
STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 提出了一种创新的视频超分辨率解决方案,针对现有模型中存在的过度平...
大型语言模型 (Large Language Models, LLMs) 的发展日新月异。从最初的简单对话系统,到如今能够执行文本生成、语言翻译和代码编写等复...
春节档电影「哪吒 2」的票房一路高歌猛进,现已突破 120 亿,成为中国首部票房达到百亿大关的影片,已成功跻身全球影史票房榜前 10。影...
1966 年,日本东北大学实验室的一组异常数据改写了能源史。当研究人员将紫罗碱染料结晶薄膜置于阳光下时,电流检测器突然跳动的信号令其...
作为早期时间序列基础模型之一,Salesforce 开发的 MOIRAI 凭借其出色的基准测试性能以及开源的大规模预训练数据集 LOTSA 在业界获得了广...
上个月,在大模型推理需求激增的背景下,AI 大模型推理框架 vLLM 正式迎来 v1.0 版本,相比之前版本,计算效率显著优化,API 设计更加稳...
医疗 AI 并非新鲜话题,但近日方舟投资首席执行官兼投资总裁凯西·伍德 (Cathie Wood) 的表态再次点燃市场热情。在她看来,医疗保健是当...
强化学习(Reinforcement Learning, RL)已成为提升大型语言模型(Large Language Models, LLMs)推理能力的重要技术手段,特别是在需要...
医学图像分割是医学影像处理领域中关键而复杂的一步,主要是通过将医学图像中具有特殊含义的部分分割提取出来,从而可为临床诊断、康复...
当前的大型语言模型在处理长序列文本时面临挑战。主要的瓶颈在于注意力机制,它将文本处理为单词(或 tokens)序列。注意力计算的复杂度...
研究者提出了一种新的关联思维链(Chain-of-Associated-Thoughts, CoAT)方法,该方法通过整合蒙特卡洛树搜索(Monte Carlo Tree Search, M...
涡轮叶片作为飞机发动机中最重要的部件之一,需要在超过 1000℃ 的高温下持续工作,同时承受巨大的机械应力。2018 年,美国西南航空的一...
蛋白质的功能很大程度上取决于其 3D 结构。19 世纪中期,科学界普遍认为蛋白质结构是固定的、刚性的,类似「锁与钥匙」模型 (lock-and-k...
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
地球科学作为一个高度跨学科的领域,正在经历一场由 AI 引领的重大变革。回顾 2024 年,研究人员在智慧城市建设、房价预测、海洋生态建...
DeepSeekMoE 是一种创新的大规模语言模型架构,通过整合专家混合系统(Mixture of Experts, MoE)、改进的注意力机制和优化的归一化策略,...
本文关注 DeepSeek-R1 在技术上最重要的突破——用纯深度学习的方法让 AI 自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
神经常微分方程(Neural ODEs)是深度学习领域的创新性模型架构,它将神经网络的离散变换扩展为连续时间动力系统。与传统神经网络将层表...
在科幻电影「阿凡达」中的潘多拉星球,那座被绿色藤蔓缠绕、悬浮于云端的哈利路亚山,无疑给观众留下了深刻的印象。其悬浮的奥秘,就在...
古话说,「人非圣贤,孰能无过」,但在医学领域,像误诊这样的「过」,造成的后果却可能是惨痛的。一方面对于患者而言,轻则虚惊一场,...