深度学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

标签主页标签问答标签文章

标签文章

最新的 · 最热的

超神经HyperAI · 2024年04月26日

一键部署 Llama3 8B/70B；COCONut上线，字节跳动推出的首个大规模全景图像分割数据集

近日，Meta 震撼发布了号称「开源 GPT-4」的大模型 Llama3，该模型惊动了整个 AI 圈，HyperAI超神经也迫不及待想要体验一下！hyper.ai ...

6 阅读 3.8k
超神经HyperAI · 2024年04月25日

纳米尺度下的单粒子追踪，厦门大学方宁团队用 AI 奏响「细胞里的摇滚」

在微观世界里，每一个细胞都是一个繁忙的城市，而分子们则是这个城市中的居民。想象一下，如果我们能够追踪这些居民的每一个动作，或许...

1 阅读 3.2k
V · 2024年04月25日

开源向量数据库比较：Chroma, Milvus, Faiss,Weaviate

语义搜索和检索增强生成(RAG)正在彻底改变我们的在线交互方式。实现这些突破性进展的支柱就是向量数据库。选择正确的向量数据库能是一项...

0 阅读 3.1k
超神经HyperAI · 2024年04月24日

解构海洋缺氧：浙大 GIS 实验室融合机器学习及卫星测绘，发布全球海表溶解氧综合建模框架

多年前，海洋专家 Eric Prince 在进行鱼类标记追踪时发现了一个异常现象：蓝色马林鱼在美国东南部通常会下潜至 800 米的深海捕食，而在...

2 阅读 2.2k
V · 2024年04月24日

使用ORPO微调Llama 3

ORPO是一种新的微调技术，它将传统的监督微调和偏好对齐阶段结合到一个过程中。减少了训练所需的计算资源和时间。论文的实证结果表明，O...

2 阅读 2.7k
超神经HyperAI · 2024年04月23日

在线教程丨刘强东数字人首秀交易额破5千万！用GeneFace++ 生成实时说话数字人

近日，京东创始人刘强东化身「采销东哥 AI 数字人」，在京东家电家居和超市的采销直播间开启了自己的直播首秀。此次直播活动观看人次超 ...

1 阅读 2.4k
超神经HyperAI · 2024年04月22日

基于美日 627 例患者的临床数据，谷歌证实 AI 辅助肺癌筛查的群体有效性

2024 年 2 月，国家癌症中心基于肿瘤登记及随访监测最新数据，形成了《2022年中国癌症发病率和死亡率》报告。报告显示，在我国，肺癌仍...

3 阅读 2.4k
V · 2024年04月22日

5种搭建LLM服务的方法和代码示例

在不断发展的大型语言模型（LLMs）领域中，用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中，我们将总结5种...

1 阅读 2.1k
汀丶人工智能 · 2024年04月19日

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择，揭秘项目落地优化之道

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 3.2k
汀丶人工智能 · 2024年04月18日

NL2SQL进阶系列(5)：论文解读业界前沿方案（DIN-SQL、C3-SQL、DAIL-SQL）

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 3.3k
超神经HyperAI · 2024年04月18日

锂电池寿命预测精度提升 20%！上海交大团队发布半监督学习方法 PBCT，提取无标签数据中的隐藏信息

锂电池具有能量密度高、充放电速度快、使用寿命长等优点，当前已被广泛应用于水力、火力、风力和太阳能电站等储能电源系统，以及电动工...

0 阅读 2.2k
V · 2024年04月18日

Moirai：Salesforce的时间序列预测基础模型

在过去的几个月中，时间序列基础模型的发展速度一直在加快，每个月都能看到新模型的发布。从TimeGPT 开始，我们看到了 Lag-Llama 的发布...

1 阅读 3k
V · 2024年04月17日

PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

这篇文章将演示如何可视化PyTorch激活层。可视化激活，即模型内各层的输出，对于理解深度神经网络如何处理视觉信息至关重要，这有助于诊...

1 阅读 2.2k
V · 2024年04月16日

ORPO偏好优化：性能和DPO一样好并且更简单的对齐方法

现在有许多方法可以使大型语言模型（LLM）与人类偏好保持一致。以人类反馈为基础的强化学习（RLHF）是最早的方法之一，并促成了ChatGPT...

0 阅读 2.3k
汀丶人工智能 · 2024年04月16日

NL2SQL进阶系列(3)：Data-Copilot、Chat2DB等优化框架开源应用实践详解

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 2.9k
V · 2024年04月15日

时空图神经网络ST-GNN的概念以及Pytorch实现

在我们周围的各个领域，从分子结构到社交网络，再到城市设计结构，到处都有相互关联的图数据。图神经网络（GNN）作为一种强大的方法，正...

1 阅读 2.4k
V · 2024年04月12日

PiSSA ：将模型原始权重进行奇异值分解的一种新的微调方法

我们开始看4月的新论文了，这是来自北京大学人工智能研究所、北京大学智能科学与技术学院的研究人员发布的Principal Singular Values an...

9 阅读 2.7k
超神经HyperAI · 2024年04月12日

14亿美元！德国默克与AI生物科技公司合作；马斯克Neuralink首位脑机接口植入者用意念打游戏

AI for Science 的新成果、新动态、新视角——日本第一 IT 公司富士通：生成式 AI 加速药物研发马斯克：Neuralink 首位脑机接口植入者用「...

2 阅读 2.6k
汀丶人工智能 · 2024年04月12日

NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

0 阅读 2.8k
V · 2024年04月11日

10个大型语言模型(LLM)常见面试问题和答案解析

今天我们来总结以下大型语言模型面试中常问的问题1、哪种技术有助于减轻基于提示的学习中的偏见?A.微调 Fine-tuningB.数据增强 Data aug...

4 阅读 2.7k

本月贡献榜

超神经HyperAI

贡献 95 声望

天罡智算杨旭颖

贡献 5 声望

关注极术微信号
实时接收点赞提醒和评论通知

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

关注安谋科技招聘
实时获取安谋科技中国职位信息

深度学习

标签文章

一键部署 Llama3 8B/70B；COCONut上线，字节跳动推出的首个大规模全景图像分割数据集

纳米尺度下的单粒子追踪，厦门大学方宁团队用 AI 奏响「细胞里的摇滚」

开源向量数据库比较：Chroma, Milvus, Faiss,Weaviate

解构海洋缺氧：浙大 GIS 实验室融合机器学习及卫星测绘，发布全球海表溶解氧综合建模框架

使用ORPO微调Llama 3

在线教程丨刘强东数字人首秀交易额破5千万！用GeneFace++ 生成实时说话数字人

基于美日 627 例患者的临床数据，谷歌证实 AI 辅助肺癌筛查的群体有效性

5种搭建LLM服务的方法和代码示例

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择，揭秘项目落地优化之道

NL2SQL进阶系列(5)：论文解读业界前沿方案（DIN-SQL、C3-SQL、DAIL-SQL）

锂电池寿命预测精度提升 20%！上海交大团队发布半监督学习方法 PBCT，提取无标签数据中的隐藏信息

Moirai：Salesforce的时间序列预测基础模型

PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

ORPO偏好优化：性能和DPO一样好并且更简单的对齐方法

NL2SQL进阶系列(3)：Data-Copilot、Chat2DB等优化框架开源应用实践详解

时空图神经网络ST-GNN的概念以及Pytorch实现

PiSSA ：将模型原始权重进行奇异值分解的一种新的微调方法

14亿美元！德国默克与AI生物科技公司合作；马斯克Neuralink首位脑机接口植入者用意念打游戏

NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解

10个大型语言模型(LLM)常见面试问题和答案解析

本月贡献榜

超神经HyperAI

天罡智算杨旭颖