AI 应用

安谋科技自研产品

SoC 芯片设计

IoT 与嵌入式

教育与职场

合作伙伴

不限文章问答人工智能 AI 芯片自动驾驶计算机视觉语音识别大模型 ...
V · 2024年04月10日

推测解码：在不降低准确性的情况下将LLM推理速度提高2 - 3倍

在本篇文章我们将详细讨论推测解码，这是一种可以将LLM推理速度提高约2 - 3倍而不降低任何准确性的方法。我们还将会介绍推测解码代码实...

3 阅读 2.6k
AI学习者 · 2024年04月10日

[小白入门]基于ERFNet车道线检测入门语义分割

AiStudio是一个很好的学习平台，我相信无时无刻都有很多像我一样的小白出于对人工智能的兴趣，而汇聚在这里。这一次，我想做一个入门级...

5 阅读 3.4k
超神经HyperAI · 2024年04月09日

内含教程丨最高可降低 16 倍成本，ComfyUI Stable Cascade 教程已上线！

2024 年 2 月，OpenAI 又一次站在了镁光灯下，Sora 横空出世并引发热烈讨论，「文生视频」的热潮被那段 60 秒的展示视频再度推高，也使...

2 阅读 2.4k
V · 2024年04月08日

为什么大型语言模型都在使用 SwiGLU 作为激活函数？

如果你一直在关注大型语言模型的架构，你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的...

1 阅读 2.8k
超神经HyperAI · 2024年04月07日

超全大模型资源汇总｜30 个优质 NLP 数据集和模型，一键使用 8 个 demo，建议收藏！

近两年来，大模型的热度持续高涨，并且开始在更广泛的领域进行落地探索。随着行业整体的快速发展，越来越多的开源大模型涌入市场，进一...

9 阅读 1.6k
V · 2024年04月07日

归一化技术比较研究：Batch Norm, Layer Norm, Group Norm

归一化层是深度神经网络体系结构中的关键，在训练过程中确保各层的输入分布一致，这对于高效和稳定的学习至关重要。归一化技术的选择（B...

2 阅读 1.9k
V · 2024年04月03日

大模型中常用的注意力机制GQA详解以及Pytorch代码实现

分组查询注意力 (Grouped Query Attention) 是一种在大型语言模型中的多查询注意力 (MQA) 和多头注意力 (MHA) 之间进行插值的方法，它的...

8 阅读 3.2k
AI学习者 · 2024年04月03日

基于PaddlePaddle复现的PeleeNet

PeleeNet: An efficient DenseNet architecture for mobile devices

8 阅读 3.1k
超神经HyperAI · 2024年04月02日

合成生物新突破！中科院罗小舟团队开发 ProEnsemble 机器学习框架：优化进化通路启动子组合

在合成生物学领域，研究人员将来自其他生物体的酶基因导入某种宿主体中，构建起新的代谢途径，可以让宿主生产出自己本身不能合成的物质...

6 阅读 2.5k
V · 2024年04月02日

SiMBA：基于Mamba的跨图像和多元时间序列的预测模型

这是3月26日新发的的论文，微软的研究人员简化的基于mamba的体系结构，并且将其同时应用在图像和时间序列中并且取得了良好的成绩。

5 阅读 2.5k
AI学习者 · 2024年04月02日

Wav2vec 系列：从原始音频中学习语音的结构

本文主要梳理Facebook AI Research 从2019年开始的发表的wav2vec系列工作，主要包括了Wav2vec、Wav2vec 2.0

4 阅读 4.9k
超神经HyperAI · 2024年04月01日

基于 7 大城市实景数据，清华大学团队开源 GPD 模型

城市，是人们安居乐业的故土，是政府开展经济建设的基石，承载着细腻的人文情怀与宏伟的国家发展脉络。长期以来，管理者一直在探寻更加...

5 阅读 2.3k
V · 2024年04月01日

大语言模型中常用的旋转位置编码RoPE详解：为什么它比绝对或相对位置编码更好?

自 2017 年发表“ Attention Is All You Need ”论文以来，Transformer 架构一直是自然语言处理 (NLP) 领域的基石。它的设计多年来基本没...

4 阅读 2.5k
AI学习者 · 2024年04月01日

1-2B参数规模大模型使用心得及模型汇总

大模型时代，根据大模型缩放定律，大家通常都在追求模型的参数规模更大、训练的数据更多，从而使得大模型涌现出更多的智能。但是，模型...

3 阅读 5k
AI学习者 · 2024年03月29日

利用GPU加速在Orange Pi 5上跑LLMs：人工智能爱好者High翻了！

视频中，我们将深入了解利用GPU加速在Orange Pi 5上跑LLMs的精彩世界。最近知乎上的一篇文章《利用GPU加速，在Orange Pi上跑LLMs》引起...

3 阅读 4.2k
V · 2024年03月29日

如何开始定制你自己的大型语言模型

2023年的大型语言模型领域经历了许多快速的发展和创新，发展出了更大的模型规模并且获得了更好的性能，那么我们普通用户是否可以定制我...

5 阅读 2.6k
超神经HyperAI · 2024年03月28日

AI 成足球比赛「关键先生」：DeepMind 发布 TacticAI，战术布局实用性高达 90%

在刚刚结束的世界杯预选赛中，国足在天津主场以 4:1 的得分大胜新加坡，一扫上一场在领先优势下被对方逼平的阴霾，也迎来了球队 2024 年...

0 阅读 3.3k
V · 2024年03月28日

Chronos: 将时间序列作为一种语言进行学习

这是一篇非常有意思的论文，它将时间序列分块并作为语言模型中的一个token来进行学习，并且得到了很好的效果。

1 阅读 2.7k
AI学习者 · 2024年03月28日

如何更有效的将深度学习算法部署在计算资源有限的设备？

深度学习已成为许多机器学习应⽤程序不可或缺的⼀部分，现在可以在⽆数电⼦设备和服务中找到，从智能⼿机和家⽤电器到⽆⼈机、机器⼈和...

4 阅读 3.9k
顶象 · 2024年03月27日

利用“AI换脸”冒充的求职者越来越多，HR该怎么发现

2022年7月，美国联邦调查局互联网犯罪投诉中心（IC3）发布了一份新的公告，该公告警告说，越来越多的诈骗分子正在使用“深度伪造”技术在...

0 阅读 4.2k
超神经HyperAI · 2024年03月27日

老药新用，中南大学团队发布 AdaDR，基于自适应图卷积网络进行药物重定位

现代社会，人类需要跟肿瘤、糖尿病、心血管疾病等日益流行的复杂疾病持续斗争，原有药品已无法完全满足市场需求，新药研发势在必行。然...

0 阅读 1.3k
V · 2024年03月27日

BurstAttention:可对非常长的序列进行高效的分布式注意力计算

提高llm中注意力机制效率的努力主要集中在两种方法上:优化单设备计算和存储能力，如FlashAttention，以及利用多设备的分布式系统，如Rin...

0 阅读 1.8k
超神经HyperAI · 2024年03月26日

在线教程 | 一键启动 Sora 开源平替，俘获 45 万 AI 开发者

1888 年，爱迪生提交了一项名为「活动电影放映机」的专利，该设备首次实现连续播放静态照片，形成类似动态画面的效果，由此拉开了视频发...

0 阅读 1.5k
超神经HyperAI · 2024年03月25日

全面挖掘天然药物的药效成分，中南大学刘韶教授团队构建 IMN4NPD 平台

1806 年，23 岁的德国药剂师 Sertürner 从罂粟中首次分离出单体吗啡，现代天然药物化学研究自此起步。在此基础上，德国化学家 Friedrich...

3 阅读 1.6k
E企研究院 · 2024年03月25日

英特尔携手超微，“至策AI，创意W限”

今年春节期间，人工智能有一个天方夜谭般的话题——奥特曼宣称要用7万亿美元扩大芯片产能。业界对这个数字的态度不必在此赘述，但显而易见...

1 阅读 1.8k
V · 2024年03月25日

使用GaLore在本地GPU进行高效的LLM调优

训练大型语言模型(llm)，即使是那些“只有”70亿个参数的模型，也是一项计算密集型的任务。这种水平的训练需要的资源超出了大多数个人爱好...

1 阅读 1.6k
汀丶人工智能 · 2024年03月25日

Prompt工程全攻略：15+Prompt框架一网打尽、学会提示词让大模型更高效

[大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning详情]([链接])

1 阅读 2.4k
汀丶人工智能 · 2024年03月22日

Prompt进阶系列4:LangGPT(构建高性能Prompt实践指南)--结构化Prompt

结构化的思想很普遍，结构化内容也很普遍，我们日常写作的文章，看到的书籍都在使用标题、子标题、段落、句子等语法结构。结构化 Prompt...

0 阅读 1.2k
超神经HyperAI · 2024年03月22日

【ScienceAI Weekly】「AI钢铁侠」黄仁勋在GTC大会聊英伟达布局科研

AI for Science 的新成果、新动态、新视角——英伟达：有众多 AI for Scinece 领域的战略内容在布局微软携手多家医疗机构推出 TRAINOverje...

0 阅读 1.6k
V · 2024年03月22日

文生图的基石CLIP模型的发展综述

CLIP的英文全称是Contrastive Language-Image Pre-training，即一种基于对比文本-图像对的预训练方法或者模型。CLIP是一种基于对比学习...

1 阅读 1.5k

上一页
1
…
19
20
21
22
23
…
下一页

频道介绍

聚焦中国智能计算生态，探索智联世界的无限可能。

提问题写文章

推荐专栏

安谋科技

144 篇内容 · 16635 关注

Arm技术博客

1097 篇内容 · 23727 关注

此芯AI PC开发套件瑞莎“星睿O6”

40 篇内容 · 2404 关注

腾讯技术工程

263 篇内容 · 8170 关注

灵动Mini-F5375-OB开发板

30 篇内容 · 770 关注

推荐用户

极术小姐姐

贡献 64602 声望

baron

贡献 5975 声望

徽州骆驼

贡献 12435 声望

vesperW

贡献 3115 声望

爱笑的小姐姐

贡献 7725 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息