在 5 月 15 日召开的百度 Apollo Day 2024 上,百度自动驾驶业务部总经理陈卓表示,萝卜快跑的目标是到 2024 年底在武汉实现收支平衡,...
7月25日,两场生态发展大会将在深圳君悦酒店同期举办。2024(第五届)国际AIoT生态发展大会将结合最新AI、计算、感知和通信技术发展趋势...
业界广泛采用 FP16、BF16 混合精度(AMP)进行模型训练。AMP 能在下游任务不掉点的前提下提升训练效率、减少显存等资源占用,如今也常用...
7月18日,由中国智能计算产业联盟与全国信标委算力标准工作组共同主办的2024中国算力发展专家研讨会在京召开。众多计算产业链顶尖院士、...
VQ-VAE 是变分自编码器(VAE)的一种改进。这些模型可以用来学习有效的表示。本文将深入研究 VQ-VAE 之前,不过,在这之前我们先讨论一...
文字是文明的标志,也是一个民族最显著的印记。甲骨文 (OBS) 作为我国已知最早且成系统的文字,承载着中华民族一脉相承的文化与文明。从...
大家好,今天我们继续vllm源码的解析,一起来看下它最近总是被频繁提起、也是较不好理解的一个创新点:Prefix Caching(本文同时也是Blo...
萝卜快跑在武汉大规模投放提供商用出行服务,近期激发了热议。其中反应最大的当属本地出租车司机,订单量受到了无人车的直接冲击。
为推进 AI4S 的普适化,降低学术机构科研成果的传播壁垒,为更多行业学者、科技爱好者及产业单位提供交流平台,HyperAI超神经策划了「Me...
扩散模型通常是一种生成式深度学习模型,它通过学习去噪过程来创建数据。扩散模型有许多变体,其中最流行的是条件文本模型,能够根据提...
初识langchain:LLM大模型+Langchain实战[qwen2.1、GLM-4]+Prompt工程1.大模型基础知识大模型三大重点:算力、数据、算法,ReAct (reas...
希腊神话中,大地女神带回一棵枝叶茂盛的大树,树上结满了金苹果,被宙斯种植在圣园,金苹果从此成为富饶和荣誉的象征。
更多 TVM 中文文档可访问 →Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。 | Apache TVM 中文...
TimesFM是一个为时间序列数据量身定制的大型预训练模型——一个无需大量再训练就能提供准确预测的模型。TimesFM有2亿参数,并在1000亿真实...
OpenAI 于 2020 年在论文「Scaling Laws for Neural Language Models」中首次提出 Scaling Laws,它被看作是大语言模型的摩尔定律。其释...
在自动驾驶和医学图像等应用中,语义分割起着关键作用。尽管现有的实时语义分割模型在准确性和速度之间取得了不错的平衡,但它们的多路...
IDC最新发布的《中国智算服务市场(2023 下半年)跟踪》报告显示,2023 下半年中国智算服务市场整体规模达到 114.1 亿元人民币,同比增...
在深度学习中,优化模型性能至关重要,特别是对于需要快速执行和实时推断的应用。而PyTorch在平衡动态图执行与高性能方面常常面临挑战。...
近期,LLM 的长文本能力越来越受到关注。LLM 处理长文本的能力可以应用在多个应用场景中,例如 LLM Agent 场景:假设 Agent 会调用不同...
生命系统中,几乎所有生物和药理过程都涉及受体(靶蛋白)和配体(小分子)之间的相互作用,这些相互作用发生在靶蛋白结构的特定区域,...
什么是化境?他说,“化”就是把一切技巧,融化在自己的表演里,自由地来表现人物的思想感情,也就是演员在台上要达到忘我的境界。演员把...
注意力机制是许多最先进神经网络架构的基本组成部分,比如Transformer模型。注意力机制中的一个关键方面是掩码,它有助于控制信息流,并...
在人工智能的浪潮中,数据中心作为智能世界的基石,正经历着前所未有的变革。随着技术的飞速发展,AI算力需求的激增,数据中心的架构、...
从这一年开始,AI 在气象领域的应用呈现爆发式增长,NVIDIA DLWP、Google MetNet-2 等一系列创新方法及模型如雨后春笋般涌现,国内外「...
“AI和画画的、开网约车的、写东西的人有仇吗?”近来成了很多从业者的心声。大模型技术驱动了AI的能力进化过临界点,我们普通人根本就跟...
训练人工神经网络最重要的挑战之一是灾难性遗忘。神经网络的灾难性遗忘(catastrophic forgetting)是指在神经网络学习新任务时,可能会...
在材料设计中,了解其电子结构与性质是预测材料性能、发现新材料、优化材料性能的关键。过去,业界广泛使用密度泛函理论 (DFT) 来研究材...
在 5 月 15 日召开的百度 Apollo Day 2024 上,百度自动驾驶业务部总经理陈卓表示,萝卜快跑的目标是到 2024 年底在武汉实现收支平衡,...
7月25日,两场生态发展大会将在深圳君悦酒店同期举办。2024(第五届)国际AIoT生态发展大会将结合最新AI、计算、感知和通信技术发展趋势...
业界广泛采用 FP16、BF16 混合精度(AMP)进行模型训练。AMP 能在下游任务不掉点的前提下提升训练效率、减少显存等资源占用,如今也常用...
7月18日,由中国智能计算产业联盟与全国信标委算力标准工作组共同主办的2024中国算力发展专家研讨会在京召开。众多计算产业链顶尖院士、...
VQ-VAE 是变分自编码器(VAE)的一种改进。这些模型可以用来学习有效的表示。本文将深入研究 VQ-VAE 之前,不过,在这之前我们先讨论一...
文字是文明的标志,也是一个民族最显著的印记。甲骨文 (OBS) 作为我国已知最早且成系统的文字,承载着中华民族一脉相承的文化与文明。从...
大家好,今天我们继续vllm源码的解析,一起来看下它最近总是被频繁提起、也是较不好理解的一个创新点:Prefix Caching(本文同时也是Blo...
萝卜快跑在武汉大规模投放提供商用出行服务,近期激发了热议。其中反应最大的当属本地出租车司机,订单量受到了无人车的直接冲击。
为推进 AI4S 的普适化,降低学术机构科研成果的传播壁垒,为更多行业学者、科技爱好者及产业单位提供交流平台,HyperAI超神经策划了「Me...
扩散模型通常是一种生成式深度学习模型,它通过学习去噪过程来创建数据。扩散模型有许多变体,其中最流行的是条件文本模型,能够根据提...
初识langchain:LLM大模型+Langchain实战[qwen2.1、GLM-4]+Prompt工程1.大模型基础知识大模型三大重点:算力、数据、算法,ReAct (reas...
希腊神话中,大地女神带回一棵枝叶茂盛的大树,树上结满了金苹果,被宙斯种植在圣园,金苹果从此成为富饶和荣誉的象征。
更多 TVM 中文文档可访问 →Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。 | Apache TVM 中文...
TimesFM是一个为时间序列数据量身定制的大型预训练模型——一个无需大量再训练就能提供准确预测的模型。TimesFM有2亿参数,并在1000亿真实...
OpenAI 于 2020 年在论文「Scaling Laws for Neural Language Models」中首次提出 Scaling Laws,它被看作是大语言模型的摩尔定律。其释...
在自动驾驶和医学图像等应用中,语义分割起着关键作用。尽管现有的实时语义分割模型在准确性和速度之间取得了不错的平衡,但它们的多路...
IDC最新发布的《中国智算服务市场(2023 下半年)跟踪》报告显示,2023 下半年中国智算服务市场整体规模达到 114.1 亿元人民币,同比增...
在深度学习中,优化模型性能至关重要,特别是对于需要快速执行和实时推断的应用。而PyTorch在平衡动态图执行与高性能方面常常面临挑战。...
近期,LLM 的长文本能力越来越受到关注。LLM 处理长文本的能力可以应用在多个应用场景中,例如 LLM Agent 场景:假设 Agent 会调用不同...
生命系统中,几乎所有生物和药理过程都涉及受体(靶蛋白)和配体(小分子)之间的相互作用,这些相互作用发生在靶蛋白结构的特定区域,...
什么是化境?他说,“化”就是把一切技巧,融化在自己的表演里,自由地来表现人物的思想感情,也就是演员在台上要达到忘我的境界。演员把...
注意力机制是许多最先进神经网络架构的基本组成部分,比如Transformer模型。注意力机制中的一个关键方面是掩码,它有助于控制信息流,并...
在人工智能的浪潮中,数据中心作为智能世界的基石,正经历着前所未有的变革。随着技术的飞速发展,AI算力需求的激增,数据中心的架构、...
从这一年开始,AI 在气象领域的应用呈现爆发式增长,NVIDIA DLWP、Google MetNet-2 等一系列创新方法及模型如雨后春笋般涌现,国内外「...
“AI和画画的、开网约车的、写东西的人有仇吗?”近来成了很多从业者的心声。大模型技术驱动了AI的能力进化过临界点,我们普通人根本就跟...
训练人工神经网络最重要的挑战之一是灾难性遗忘。神经网络的灾难性遗忘(catastrophic forgetting)是指在神经网络学习新任务时,可能会...
在材料设计中,了解其电子结构与性质是预测材料性能、发现新材料、优化材料性能的关键。过去,业界广泛使用密度泛函理论 (DFT) 来研究材...