AI 应用

阿里云倚天

AVH on 百度云

龙蜥操作系统

Arm STEM 教育

星辰教学平台

安谋科技XPU

SoC 芯片设计

IoT 与嵌入式

教育与职场

合作伙伴

不限文章问答人工智能 AI 芯片自动驾驶计算机视觉语音识别大模型 ...
汀丶人工智能 · 1 天前

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择，揭秘项目落地优化之道

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 314
汀丶人工智能 · 2 天前

NL2SQL进阶系列(5)：论文解读业界前沿方案（DIN-SQL、C3-SQL、DAIL-SQL）

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 543
超神经HyperAI · 2 天前

锂电池寿命预测精度提升 20%！上海交大团队发布半监督学习方法 PBCT，提取无标签数据中的隐藏信息

锂电池具有能量密度高、充放电速度快、使用寿命长等优点，当前已被广泛应用于水力、火力、风力和太阳能电站等储能电源系统，以及电动工...

0 阅读 557
V · 2 天前

Moirai：Salesforce的时间序列预测基础模型

在过去的几个月中，时间序列基础模型的发展速度一直在加快，每个月都能看到新模型的发布。从TimeGPT 开始，我们看到了 Lag-Llama 的发布...

1 阅读 560
V · 3 天前

PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

这篇文章将演示如何可视化PyTorch激活层。可视化激活，即模型内各层的输出，对于理解深度神经网络如何处理视觉信息至关重要，这有助于诊...

1 阅读 750
V · 4 天前

ORPO偏好优化：性能和DPO一样好并且更简单的对齐方法

现在有许多方法可以使大型语言模型（LLM）与人类偏好保持一致。以人类反馈为基础的强化学习（RLHF）是最早的方法之一，并促成了ChatGPT...

0 阅读 940
汀丶人工智能 · 4 天前

NL2SQL进阶系列(3)：Data-Copilot、Chat2DB等优化框架开源应用实践详解

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 937
V · 5 天前

时空图神经网络ST-GNN的概念以及Pytorch实现

在我们周围的各个领域，从分子结构到社交网络，再到城市设计结构，到处都有相互关联的图数据。图神经网络（GNN）作为一种强大的方法，正...

1 阅读 1.1k
V · 4月12日

PiSSA ：将模型原始权重进行奇异值分解的一种新的微调方法

我们开始看4月的新论文了，这是来自北京大学人工智能研究所、北京大学智能科学与技术学院的研究人员发布的Principal Singular Values an...

9 阅读 1.8k
超神经HyperAI · 4月12日

14亿美元！德国默克与AI生物科技公司合作；马斯克Neuralink首位脑机接口植入者用意念打游戏

AI for Science 的新成果、新动态、新视角——日本第一 IT 公司富士通：生成式 AI 加速药物研发马斯克：Neuralink 首位脑机接口植入者用「...

2 阅读 1.7k
汀丶人工智能 · 4月12日

NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 1.5k
V · 4月11日

10个大型语言模型(LLM)常见面试问题和答案解析

今天我们来总结以下大型语言模型面试中常问的问题1、哪种技术有助于减轻基于提示的学习中的偏见?A.微调 Fine-tuningB.数据增强 Data aug...

4 阅读 1.9k
超神经HyperAI · 4月11日

透视 Insilico 英矽智能：AI 制药明星企业的飞跃、困境与破局

衰老，从古至今困扰了无数仁人志士。无论是千古一帝秦始皇，还是雄才大略汉武帝，亦或者挥斥方遒唐太宗，这些伟大的帝王无一例外的都留...

2 阅读 1.7k
汀丶人工智能 · 4月10日

NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型全面对比优劣分析

Text-to-SQL（或者Text2SQL），顾名思义就是把文本转化为SQL语言，更学术一点的定义是：把数据库领域下的自然语言（Natural Language，N...

7 阅读 2k
超神经HyperAI · 4月10日

血常规、尿检等指标就能识别卵巢癌！中山大学刘继红团队牵头，四大医学院联合构建 AI 融合模型

根据国家卫生健康委员会发布的《卵巢癌诊疗指南（2022 版）》，我国卵巢癌年发病率居女性生殖系统肿瘤第 3 位，仅次于子宫颈癌和子宫体...

1 阅读 1.8k
V · 4月10日

推测解码：在不降低准确性的情况下将LLM推理速度提高2 - 3倍

在本篇文章我们将详细讨论推测解码，这是一种可以将LLM推理速度提高约2 - 3倍而不降低任何准确性的方法。我们还将会介绍推测解码代码实...

3 阅读 1.8k
AI学习者 · 4月10日

[小白入门]基于ERFNet车道线检测入门语义分割

AiStudio是一个很好的学习平台，我相信无时无刻都有很多像我一样的小白出于对人工智能的兴趣，而汇聚在这里。这一次，我想做一个入门级...

5 阅读 1.9k
超神经HyperAI · 4月9日

内含教程丨最高可降低 16 倍成本，ComfyUI Stable Cascade 教程已上线！

2024 年 2 月，OpenAI 又一次站在了镁光灯下，Sora 横空出世并引发热烈讨论，「文生视频」的热潮被那段 60 秒的展示视频再度推高，也使...

2 阅读 1.7k
V · 4月8日

为什么大型语言模型都在使用 SwiGLU 作为激活函数？

如果你一直在关注大型语言模型的架构，你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的...

1 阅读 1.7k
超神经HyperAI · 4月7日

超全大模型资源汇总｜30 个优质 NLP 数据集和模型，一键使用 8 个 demo，建议收藏！

近两年来，大模型的热度持续高涨，并且开始在更广泛的领域进行落地探索。随着行业整体的快速发展，越来越多的开源大模型涌入市场，进一...

9 阅读 929
V · 4月7日

归一化技术比较研究：Batch Norm, Layer Norm, Group Norm

归一化层是深度神经网络体系结构中的关键，在训练过程中确保各层的输入分布一致，这对于高效和稳定的学习至关重要。归一化技术的选择（B...

2 阅读 1.3k
V · 4月3日

大模型中常用的注意力机制GQA详解以及Pytorch代码实现

分组查询注意力 (Grouped Query Attention) 是一种在大型语言模型中的多查询注意力 (MQA) 和多头注意力 (MHA) 之间进行插值的方法，它的...

8 阅读 1.9k
AI学习者 · 4月3日

基于PaddlePaddle复现的PeleeNet

PeleeNet: An efficient DenseNet architecture for mobile devices

7 阅读 2k
超神经HyperAI · 4月2日

合成生物新突破！中科院罗小舟团队开发 ProEnsemble 机器学习框架：优化进化通路启动子组合

在合成生物学领域，研究人员将来自其他生物体的酶基因导入某种宿主体中，构建起新的代谢途径，可以让宿主生产出自己本身不能合成的物质...

6 阅读 1.9k
V · 4月2日

SiMBA：基于Mamba的跨图像和多元时间序列的预测模型

这是3月26日新发的的论文，微软的研究人员简化的基于mamba的体系结构，并且将其同时应用在图像和时间序列中并且取得了良好的成绩。

5 阅读 1.9k
AI学习者 · 4月2日

Wav2vec 系列：从原始音频中学习语音的结构

本文主要梳理Facebook AI Research 从2019年开始的发表的wav2vec系列工作，主要包括了Wav2vec、Wav2vec 2.0

3 阅读 1.8k
超神经HyperAI · 4月1日

基于 7 大城市实景数据，清华大学团队开源 GPD 模型

城市，是人们安居乐业的故土，是政府开展经济建设的基石，承载着细腻的人文情怀与宏伟的国家发展脉络。长期以来，管理者一直在探寻更加...

5 阅读 1.9k
V · 4月1日

大语言模型中常用的旋转位置编码RoPE详解：为什么它比绝对或相对位置编码更好?

自 2017 年发表“ Attention Is All You Need ”论文以来，Transformer 架构一直是自然语言处理 (NLP) 领域的基石。它的设计多年来基本没...

4 阅读 1.8k
AI学习者 · 4月1日

1-2B参数规模大模型使用心得及模型汇总

大模型时代，根据大模型缩放定律，大家通常都在追求模型的参数规模更大、训练的数据更多，从而使得大模型涌现出更多的智能。但是，模型...

3 阅读 2.5k
AI学习者 · 3月29日

利用GPU加速在Orange Pi 5上跑LLMs：人工智能爱好者High翻了！

视频中，我们将深入了解利用GPU加速在Orange Pi 5上跑LLMs的精彩世界。最近知乎上的一篇文章《利用GPU加速，在Orange Pi上跑LLMs》引起...

3 阅读 2.8k
点击载入更多

频道介绍

聚焦中国智能计算生态，探索智联世界的无限可能。

提问题写文章

最近活动

activity images

【报名】2024年全国大学生物联网设计竞赛安谋科技赛题，基于搭载STAR-MC1内核的星辰开发板套件

6 月 15 日周六

推荐专栏

极术读书

140 篇内容 · 22984 关注

Arm服务器

73 篇内容 · 17322 关注

企业存储技术

235 篇内容 · 5553 关注

Arm精选

190 篇内容 · 9429 关注

芯擎AI开发板

20 篇内容 · 1236 关注

推荐用户

徽州骆驼

贡献 8915 声望

碎碎思

贡献 3640 声望

上海航芯

贡献 2105 声望

Happy

贡献 2895 声望

黑船

贡献 920 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息