指标收集是每个机器学习项目不可或缺的组成部分,它使我们能够跟踪模型性能并监控训练进度。理想情况下,我们希望在不给训练过程带来额...
2023 年 11 月,美国劳伦斯伯克利国家实验室的科学家们围着一台机械臂屏息凝神——这个名为 A-Lab 的 AI 材料合成平台刚刚在连续成功制备 ...
近端策略优化(Proximal Policy Optimization, PPO)算法作为一种高效的策略优化方法,在深度强化学习领域获得了广泛应用。特别是在大语言...
本文系统性地阐述了大型语言模型(Large Language Models, LLMs)中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制...
相信很多喜爱漫威电影的朋友都曾被这一幕所惊艳,在电影「钢铁侠 2」中,人工智能管家贾维斯通过采集斯塔克的血液样本,利用深度学习算...
2021 年,OpenAI 发布了革命性的 CLIP (Contrastive Language-ImagePre-training) 模型——通过无监督学习的方式,CLIP 在不需要额外标注...
STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 提出了一种创新的视频超分辨率解决方案,针对现有模型中存在的过度平...
大型语言模型 (Large Language Models, LLMs) 的发展日新月异。从最初的简单对话系统,到如今能够执行文本生成、语言翻译和代码编写等复...
春节档电影「哪吒 2」的票房一路高歌猛进,现已突破 120 亿,成为中国首部票房达到百亿大关的影片,已成功跻身全球影史票房榜前 10。影...
1966 年,日本东北大学实验室的一组异常数据改写了能源史。当研究人员将紫罗碱染料结晶薄膜置于阳光下时,电流检测器突然跳动的信号令其...
作为早期时间序列基础模型之一,Salesforce 开发的 MOIRAI 凭借其出色的基准测试性能以及开源的大规模预训练数据集 LOTSA 在业界获得了广...
上个月,在大模型推理需求激增的背景下,AI 大模型推理框架 vLLM 正式迎来 v1.0 版本,相比之前版本,计算效率显著优化,API 设计更加稳...
医疗 AI 并非新鲜话题,但近日方舟投资首席执行官兼投资总裁凯西·伍德 (Cathie Wood) 的表态再次点燃市场热情。在她看来,医疗保健是当...
强化学习(Reinforcement Learning, RL)已成为提升大型语言模型(Large Language Models, LLMs)推理能力的重要技术手段,特别是在需要...
医学图像分割是医学影像处理领域中关键而复杂的一步,主要是通过将医学图像中具有特殊含义的部分分割提取出来,从而可为临床诊断、康复...
当前的大型语言模型在处理长序列文本时面临挑战。主要的瓶颈在于注意力机制,它将文本处理为单词(或 tokens)序列。注意力计算的复杂度...
研究者提出了一种新的关联思维链(Chain-of-Associated-Thoughts, CoAT)方法,该方法通过整合蒙特卡洛树搜索(Monte Carlo Tree Search, M...
涡轮叶片作为飞机发动机中最重要的部件之一,需要在超过 1000℃ 的高温下持续工作,同时承受巨大的机械应力。2018 年,美国西南航空的一...
蛋白质的功能很大程度上取决于其 3D 结构。19 世纪中期,科学界普遍认为蛋白质结构是固定的、刚性的,类似「锁与钥匙」模型 (lock-and-k...
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]