深度学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

标签主页标签问答标签文章

标签文章

最新的 · 最热的

V · 2023年12月14日

使用GAN进行异常检测

自从基于Stable Diffusion的生成模型大火以后，基于GAN的研究越来越少了，但是这并不能说明他就没有用了。异常检测是多个研究领域面临的...

1 阅读 1.9k
汀丶人工智能 · 2023年12月13日

GPTs prompts灵感库：创意无限，专业级创作指南，打造吸睛之作的秘诀

GPTs prompts灵感库：创意无限，专业级创作指南，打造吸睛之作的秘诀优质prompt展示1.1 极简翻译中英文转换 {代码...} 1.2 完蛋，我被美...

1 阅读 2.8k
V · 2023年12月13日

AutoGen多代理对话项目示例和工作流程分析

在这篇文章中，我将介绍AutoGen的多个代理的运行。这些代理将能够相互对话，协作评估股票价格，并使用AmCharts生成图表。

0 阅读 1.5k
汀丶人工智能 · 2023年12月12日

聊天记录年度报告一览无余：轻松多格式导出永久保存，深度智能分析

一个用于提取微信聊天记录的工具，支持将聊天记录导出成HTML、Word、CSV文档，以实现永久保存。此外，该工具还具有对聊天记录进行分析的...

1 阅读 2.9k
V · 2023年12月12日

CLIP的升级版Alpha-CLIP：区域感知创新与精细控制

为了增强CLIP在图像理解和编辑方面的能力，上海交通大学、复旦大学、香港中文大学、上海人工智能实验室、澳门大学以及MThreads Inc.等知...

0 阅读 1.9k
V · 2023年12月11日

使用PyTorch II的新特性加快LLM推理速度

Pytorch团队提出了一种纯粹通过PyTorch新特性在的自下而上的优化LLM方法，包括:Torch.compile: PyTorch模型的编译器GPU量化:通过降低精...

1 阅读 1.6k
汀丶人工智能 · 2023年12月04日

人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景

LLM（Large Language Model）技术是一种基于深度学习的自然语言处理技术，旨在训练能够处理和生成自然语言文本的大型模型。

2 阅读 3.4k
超神经HyperAI · 2023年12月01日

领先人类 800 年？DeepMind利用深度学习预测 220 万种新晶体

AI 工具 GNoME 发现 220 万种新晶体，相当于人类科学家 800 年的实验产出，其中 38 万种新晶体可以成为未来高新技术的稳定材料。

1 阅读 1.5k
V · 2023年11月30日

使用Accelerate库在多GPU上进行LLM推理

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长，推理的计算需求也显著增加。为了应对这一挑战...

1 阅读 1.9k
V · 2023年11月29日

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta，这可...

0 阅读 1.8k
V · 2023年11月27日

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta，这可...

1 阅读 1.4k
V · 2023年11月24日

斯坦福大学引入FlashFFTConv来优化机器学习中长序列的FFT卷积

斯坦福大学的FlashFFTConv优化了扩展序列的快速傅里叶变换(FFT)卷积。该方法引入Monarch分解，在FLOP和I/O成本之间取得平衡，提高模型质...

1 阅读 1.5k
汀丶人工智能 · 2023年11月23日

全新Self-RAG框架亮相，自适应检索增强助力超越ChatGPT与Llama2

大型语言模型（LLMs）具有出色的能力，但由于完全依赖其内部的参数化知识，它们经常产生包含事实错误的回答，尤其在长尾知识中。

2 阅读 2.7k
AI学习者 · 2023年11月23日

深度学习部署神器——triton-inference-server入门教程指北

老潘用triton有两年多了，一直想写个教程给大家。顺便自己学习学习，拖了又拖，趁着这次换版本的机会，终于有机会了写了。

2 阅读 2.5k
V · 2023年11月23日

使用ExLlamaV2量化并运行EXL2模型

量化大型语言模型(llm)是减少这些模型大小和加快推理速度的最流行的方法。在这些技术中，GPTQ在gpu上提供了惊人的性能。与非量化模型相...

0 阅读 1.6k
汀丶人工智能 · 2023年11月22日

应对数据爆炸时代，揭秘向量数据库如何成为AI开发者的新宠，各数据库差异对比

随着大模型的爆火，向量数据库也越发成为开发者关注的焦点。为了方便大家更好地了解向量数据库，我们特地推出了《Hello, VectorDB》系列...

1 阅读 2.4k
汀丶人工智能 · 2023年11月21日

激发创新，助力研究：CogVLM，强大且开源的视觉语言模型亮相

CogVLM 是一个强大的开源视觉语言模型（VLM）。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。

2 阅读 2.7k
V · 2023年11月21日

使用FP8加速PyTorch训练

现代的人工智能硬件架构(例如，Nvidia Hopper, Nvidia Ada Lovelace和Habana Gaudi2)中，FP8张量内核能够显著提高每秒浮点运算(FLOPS)，...

1 阅读 1.7k
超神经HyperAI · 2023年11月20日

华东理工李洪林课题组开发 Macformer，加速大环类药物发现

大环类化合物是指由 12 个以上原子组成的小分子或肽。相较于其他小分子化合物，大环类化合物在结构和性能上有着诸多优势，也因此被视为...

0 阅读 1.6k
深圳湾 · 2023年11月20日

智能助手的大模型进化浪潮，OPPO 小布助手也正式交卷了

近半年来如火如荼的「百模大战」让越来越多的终端厂商卷进来，机器人、音箱、手表、眼镜等硬智能硬件产品加持大模型能力，让产品快速接...

1 阅读 2.8k

本月贡献榜

超神经HyperAI

贡献 95 声望

天罡智算杨旭颖

贡献 5 声望

关注极术微信号
实时接收点赞提醒和评论通知

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

关注安谋科技招聘
实时获取安谋科技中国职位信息

深度学习

标签文章

使用GAN进行异常检测

GPTs prompts灵感库：创意无限，专业级创作指南，打造吸睛之作的秘诀

AutoGen多代理对话项目示例和工作流程分析

聊天记录年度报告一览无余：轻松多格式导出永久保存，深度智能分析

CLIP的升级版Alpha-CLIP：区域感知创新与精细控制

使用PyTorch II的新特性加快LLM推理速度

人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景

领先人类 800 年？DeepMind利用深度学习预测 220 万种新晶体

使用Accelerate库在多GPU上进行LLM推理

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

斯坦福大学引入FlashFFTConv来优化机器学习中长序列的FFT卷积

全新Self-RAG框架亮相，自适应检索增强助力超越ChatGPT与Llama2

深度学习部署神器——triton-inference-server入门教程指北

使用ExLlamaV2量化并运行EXL2模型

应对数据爆炸时代，揭秘向量数据库如何成为AI开发者的新宠，各数据库差异对比

激发创新，助力研究：CogVLM，强大且开源的视觉语言模型亮相

使用FP8加速PyTorch训练

华东理工李洪林课题组开发 Macformer，加速大环类药物发现

智能助手的大模型进化浪潮，OPPO 小布助手也正式交卷了

本月贡献榜

超神经HyperAI

天罡智算杨旭颖