近日,由北大、腾讯 AI Lab 联合推出的 AI 视频生成工具 DynamiCrafter 一经上线便引起了巨大反响。只需要输入一张普普通通的静态图,加...
1986 年,CCTV-1 播出的《葫芦娃》一经亮相便收获了广泛好评,更是成为无数 80 后、90 后珍贵的童年回忆,但这部经典动画,其实是由工作...
本文总结了2024年5月第四周发表的一些最重要的LLM论文。这些论文的主题包括模型优化和缩放到推理、基准测试和增强性能。
模型的推理过程是一个复杂函数的计算过程,这个计算一般以矩阵乘法为主,也就是涉及到了并行计算。一般来说,单核CPU可以进行的计算种类...
训练后的模型会用于推理或者部署。推理即使用模型用输入获得输出的过程,部署是将模型发布到恒定运行的环境中推理的过程。一般来说,LLM...
拥有高质量图像生成能力的 InstantID 一经发布,便在开源领域掀起一股热潮,不仅获得了图灵奖得主 Yann LeCun 等技术大佬的点赞,更是在...
不久前,一群来自小红书的 95 后工程师联合北大团队发布了开源项目「InstantID」,只需上传一张照片,这款 AI 写真神器就能轻松定制多种...
在处理长序列时,Transformers面临着注意力分散和噪音增加等挑战。随着序列长度的增长,每个词元必须与更多词元竞争注意力得分,这会导...
上周,中国气象局首次发布了「人工智能气象大模型训练专题数据目录」,汇集了海量气象数据。该目录现已在气象局官网提供下载,可以根据...
人们仰望星空,那些遥远的星光其实已经穿越了数十亿年的时空,诉说着古老的故事。而中性碳吸收线,作为早期星系内冷气体云块的关键探针...
特征选择是构建机器学习模型过程中的决定性步骤。为模型和我们想要完成的任务选择好的特征,可以提高性能。
5 月 17 日,马斯克公开表示,继今年年初首次成功将大脑芯片植入患者大脑后,Neuralink 正在寻找第二位受试者接受这项手术。
大型语言模型(llm)是在巨大的文本语料库上训练的,在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中,然后可以在需要时使用...
自OpenAI推出 Sora 以来,「文生视频」概念及相关应用备受瞩目。而伴随 Sora 的大热,其背后的关键技术,DiT(Diffusion Transformers) ...
前一篇文章总结了关于计算机视觉方面的论文,这篇文章将要总结了2024年5月发表的一些最重要的大语言模型的论文。这些论文涵盖了塑造下一...
LLM 大模型学习必知必会系列(三):LLM和多模态模型高效推理实践1.多模态大模型推理LLM 的推理流程:多模态的 LLM 的原理:代码演示:使...
Transformers 已经确立了自己作为首要模型架构的地位,特别是因为它们在各种任务中的出色表现。但是Transformers 的内存密集型性质和随...
最近本人写了一篇介绍Arm Scalable Matrix Extension (可伸缩矩阵扩展,SME)的文章,[链接]。此为中文版,也加入了部分Introducing Armv...
在PyTorch中,FP8(8-bit 浮点数)是一个较新的数据类型,用于实现高效的神经网络训练和推理。它主要被设计来降低模型运行时的内存占用...
该论文探讨了Mamba架构(包含状态空间模型SSM)是否有必要用于视觉任务,如图像分类、目标检测和语义分割。通过实验证实了了Mamba在视觉...