AI 应用

安谋科技自研产品

SoC 芯片设计

IoT 与嵌入式

教育与职场

合作伙伴

不限文章问答人工智能 AI 芯片自动驾驶计算机视觉语音识别大模型 ...
V · 2024年09月05日

使用PyTorch从零构建Llama 3

我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后，有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了，本文将详细指导如何从...

1 阅读 713
超神经HyperAI · 2024年09月04日

【TVM 教程】在 Relay 中使用外部库

Apache TVM 是一个端到端的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 → [链接]作者：Masahi...

1 阅读 561
超神经HyperAI · 2024年09月04日

覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4

随着人工智能技术的飞速发展，大语言模型 (LLMs) 凭借其强大的自然语言处理能力，在生命科学、海洋学、材料化学等科学研究中被广泛应用...

0 阅读 548
V · 2024年09月04日

压缩大型语言模型(LLMs):缩小10倍、性能保持不变

尽管LLMs的巨大规模使其在广泛的应用场景中表现卓越,但这也为其在实际问题中的应用带来了挑战。本文将探讨如何通过压缩LLMs来应对这些挑...

0 阅读 680
超神经HyperAI · 2024年09月03日

在线教程 | 1 分钟生成万字悬疑小说，LongWriter-glm4-9b 突破长文输出瓶颈

近年来，大语言模型 (LLM) 在理解和生成复杂文本时展现出强大的能力，能够处理高达 100,000 个 tokens 的输入，但在生成超过 2,000 词的...

0 阅读 657
超神经HyperAI · 2024年09月03日

美国科学院院刊封面文章！中国团队发布可晶圆级生产的人工智能自适应微型光谱仪

光的波长探测在科学研究和工业应用中具有重要作用，光学光谱仪是其中不可或缺的分析工具。如今，体积庞大的传统光谱仪已经无法满足日益...

0 阅读 555
V · 2024年09月03日

一文读懂蒙特卡洛算法：从概率模拟到机器学习模型优化的全方位解析

1945年，在第二次世界大战即将结束之际，一场看似简单的纸牌游戏引发了计算领域的重大突破。这项突破最终导致了蒙特卡洛方法的诞生。参...

0 阅读 1.3k
V · 2024年09月02日

CNN中的注意力机制综合指南：从理论到Pytorch代码实现

注意力机制已经成为深度学习模型，尤其是卷积神经网络（CNN）中不可或缺的组成部分。通过使模型能够选择性地关注输入数据中最相关的部分...

1 阅读 807
超神经HyperAI · 2024年08月30日

10k 星开源数据处理工具一键启动！首个高层坠物检测数据集上线，含 18 个场景的近 2k 个视频

在人工智能领域，多模态数据处理一直是个难题。面对复杂的 PDF、网页和多种格式电子书，有效提取关键信息并非易事。

0 阅读 555
V · 2024年08月30日

PyTorch数据处理：torch.utils.data模块的7个核心函数详解

在机器学习和深度学习项目中,数据处理是至关重要的一环。PyTorch作为一个强大的深度学习框架,提供了多种灵活且高效的数据处理工具。本文...

0 阅读 773
超神经HyperAI · 2024年08月29日

【TVM 教程】构建图卷积网络

本文介绍如何用 Relay 构建图卷积网络（GCN）。本教程演示在 Cora 数据集上运行 GCN。Cora 数据集是图神经网络（GNN）的 benchmark，同...

1 阅读 768
超神经HyperAI · 2024年08月29日

含 14 万张图像！华中科技大学发布高质量甲骨文数据集，助力团队摘冠 ACL 最佳论文

以史观今，一直以来，人们从未停止对历史史实的探寻，而文字无疑是历代文明存活的最佳印记，更是了解其发展历程的途径。甲骨文 (OBS) 是...

0 阅读 688
V · 2024年08月29日

深入理解GPU内存分配：机器学习工程师的实用指南与实验

给定一个模型架构、数据类型、输入形状和优化器,你能否计算出前向传播和反向传播所需的GPU内存量?要回答这个问题,我们需要将流程分解为...

1 阅读 601
V · 2024年08月28日

使用 Python TorchRL 进行多代理强化学习

随着多代理系统的出现,强化学习的复杂性不断增加。为了管理这种复杂性,像 TorchRL 这样的专门工具提供了一个强大的框架,可以开发和实验...

0 阅读 695
V · 2024年08月27日

时间序列特征提取：从理论到Python代码实践

时间序列是一种特殊的存在。这意味着你对表格数据或图像进行的许多转换/操作/处理技术对于时间序列来说可能根本不起作用。

2 阅读 630
V · 2024年08月26日

XGBoost中正则化的9个超参数

正则化是一种强大的技术,通过防止过拟合来提高模型性能。本文将探索各种XGBoost中的正则化方法及其优势。

0 阅读 666
超神经HyperAI · 2024年08月25日

清华大学开源 LongWriter-6k 数据集；7 个 CCF A 类顶会即将截稿

当前的长上下文大模型虽能处理海量文本的输入，但由于长输出示例的匮乏，使其在生成长篇内容时却力不从心。为解决这个问题，清华大学的...

1 阅读 544
超神经HyperAI · 2024年08月25日

一键下载Meta最大视频分割数据集！含50.9K真实世界视频，覆盖47个国家

2023 年 4 月，Meta 发布 Segment Anything Model (SAM)，号称能够「分割一切」，这一颠覆传统计算机视觉 (CV) 任务的创新性成果引起了...

1 阅读 756
V · 2024年08月23日

基于重要性加权的LLM自我改进：考虑分布偏移的新框架

LLM自我改进的典型范式是在自生成数据上训练LLM,但是其中的部分数据可能有害,所以应该被过滤掉。但是目前的工作主要采用基于答案正确性...

0 阅读 851
V · 2024年08月22日

基于距离度量学习的异常检测：一种通过相关距离度量的异常检测方法

异常通常被定义为数据集中与大多数其他项目非常不同的项目。或者说任何与所有其他记录(或几乎所有其他记录)显著不同的记录,并且与其他记...

0 阅读 644
汀丶人工智能 · 2024年08月22日

从海量信息中脱颖而出：Workflow智能分析解决方案，为AI科技文章打造精准摘要评分体系

该项目整合了编程、AI、产品设计、商业科技及个人成长等多领域的精华内容，源自顶尖技术企业和社群。借助先进语言模型技术，对精选文章...

0 阅读 4.3k
超神经HyperAI · 2024年08月21日

【TVM 教程】使用 tvmc 接口在 Adreno™ 上部署预训练模型

此外，您应该已经为 Android 构建了 TVM。请参阅以下说明，了解如何构建它并设置 RPC 环境。

1 阅读 553
V · 2024年08月21日

泊松自助法（Poisson Bootstrap Sampling）：大型数据集上的自助抽样

自助抽样可以根据收集的样本推断总体的统计特征(如均值、十分位数、置信区间)。泊松自助抽样（Poisson Bootstrap Sampling）是一种用于...

1 阅读 687
超神经HyperAI · 2024年08月20日

上海交大周冰心博士：锚定稀缺生物数据挑战，图神经网络重塑蛋白质理解与生成

8 月 12 日，上海交通大学 AI for Bioengineering 暑期学校正式开幕，吸引了来自国内外 30 余所高校和 27 家企业的百余名业内人士。在为...

0 阅读 708
V · 2024年08月20日

深入理解双变量（二元）正态投影：理论基础、直观解释与应用实例

在统计学和机器学习中,理解变量之间的关系对于构建预测模型和分析数据至关重要。探索这些关系的一种基本技术是双变量投影 bivariate pro...

0 阅读 701
V · 2024年08月19日

三元组损失Triplet loss 详解

深度神经网络在识别模式和进行预测方面表现出色,但在涉及图像识别任务时,它们常常难以区分相似个体的图像。三元组损失是一种强大的训练...

2 阅读 1k
超神经HyperAI · 2024年08月16日

【TVM 教程】在 Adreno™ 上部署预训练模型

更多 TVM 中文文档可访问 →[链接]本文是一个逐步教程，演示如何在 Adreno 上（不同精度）部署预训练的 PyTorch ResNet-18 模型。

1 阅读 818
超神经HyperAI · 2024年08月16日

实现蛋白质数据与文本信息跨模态解读，中科大王翔团队提出蛋白质-文本生成框架ProtT3

探索蛋白质动态结构的奥秘，不仅是推动新药研发的关键一步，更是理解生命过程的重要基石。然而，蛋白质的复杂性让人们难以直接捕捉并解...

0 阅读 633
V · 2024年08月16日

LongWriter: 基于LLM代理可以将输出窗口大小扩展到10,000+个单词

LLM可以处理长达100,000个token的输入,但在生成超过2,000词的适度长度输出时仍然面临困难,因为模型的有效生成长度本质上受到其在监督微...

0 阅读 711
V · 2024年08月15日

60行代码就可以训练/微调 Segment Anything 2 (SAM 2)

SAM2（Segment Anything 2）是Meta开发的一个新模型，可以对图像中的任何物体进行分割，而不局限于特定的类别或领域。这个模型的独特之...

1 阅读 919

上一页
1
…
12
13
14
15
16
…
下一页

频道介绍

聚焦中国智能计算生态，探索智联世界的无限可能。

提问题写文章

推荐专栏

安谋科技

144 篇内容 · 16630 关注

Arm技术博客

1097 篇内容 · 23727 关注

此芯AI PC开发套件瑞莎“星睿O6”

40 篇内容 · 2399 关注

腾讯技术工程

263 篇内容 · 8170 关注

灵动Mini-F5375-OB开发板

30 篇内容 · 765 关注

推荐用户

极术小姐姐

贡献 64602 声望

baron

贡献 5975 声望

徽州骆驼

贡献 12435 声望

vesperW

贡献 3115 声望

爱笑的小姐姐

贡献 7725 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息