深度学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

标签主页标签问答标签文章

标签文章

最新的 · 最热的

超神经HyperAI · 2024年03月14日

英伟达 2024 GTC 倒计时，黄仁勋会带来面向中国市场的新举措吗？

如今，大模型、AIGC、AGI 等概念的热潮一浪高过一浪。除了暗中内卷的科技大厂之外，在技术、供应链、产业生态等方面都拥有高壁垒的英伟...

3 阅读 1.1k
V · 2024年03月14日

MADQN：多代理合作强化学习

处理单一任务是强化学习的基础，它的目标是在不确定的环境中采取最佳行动，产生相对于任务的最大长期回报。但是在多代理强化学习中，因...

4 阅读 1.7k
汀丶人工智能 · 2024年03月13日

Prompt进阶2:LangGPT(构建高性能Prompt策略和技巧)--最佳实践指南

左图右图 prompt 基本是一样的，差别只在提示工程这个词是否用中英文表达。我们看到，一词之差，回答质量天壤之别。为了获得理想的模型...

1 阅读 1.1k
V · 2024年03月13日

2024年3月最新的深度学习论文推荐

学习速率为什么会迁移？本研究试图从理论上解释MuP超参数传递的成功之处。根据其创作者的说法，训练损失的Hessian矩阵的最大特征值不受...

3 阅读 1.2k
超神经HyperAI · 2024年03月12日

清华大学研究团队发布条件去噪扩散模型 SPDiff，实现长程人流移动模拟

人流移动模拟 (Crowd Simulation) 是在特定情境中模拟大量人员移动的过程。这项技术主要应用于计算机游戏、城市规划、建筑设计以及交通...

2 阅读 1.4k
V · 2024年03月11日

从16-bit 到 1.58-bit ：大模型内存效率和准确性之间的最佳权衡

通过量化可以减少大型语言模型的大小，但是量化是不准确的，因为它在过程中丢失了信息。通常较大的llm可以在精度损失很小的情况下量化到...

2 阅读 1.6k
超神经HyperAI · 2024年03月10日

部署到 Adreno™ GPU

Adreno™ GPU 可以加速复杂几何图形的渲染，在提供高性能图形和丰富的用户体验的同时拥有很低的功耗。

3 阅读 1.7k
汀丶人工智能 · 2024年03月08日

Prompt进阶系列1:LangGPT(从编程语言反思LLM的结构化可复用提示设计框架)

大语言模型 (Large Language Models, LLMs) 在不同领域都表现出了优异的性能。然而，对于非AI专家来说，制定高质量的提示来引导 LLMs 是...

8 阅读 1.4k
超神经HyperAI · 2024年03月08日

妇女节特刊 | 上海交大吴梦玥：用言语智能技术，为精神疾病开出第一张诊疗单

从孩童的咿呀学语，到青年时期聊不完的少年心事，进而人到中年，耳边既有父母长辈的叮咛关切，也有生活压力一刻不停的催促……细细回想，...

0 阅读 875
V · 2024年03月08日

StarCoder 2：GitHub Copilot本地开源LLM替代方案

GitHub CoPilot拥有超过130万付费用户，部署在5万多个组织中，是世界上部署最广泛的人工智能开发工具。使用LLM进行编程辅助工作不仅提高...

21 阅读 1.3k
超神经HyperAI · 2024年03月07日

HyperAI超神经 x DT新材料丨AI技术在化学与材料科学科研中应用研讨会开启报名

人工智能 (AI)是近年来发展最快的领域之一，其在科研领域显示出巨大潜力与争议。AI 可以通过自动化分析和处理数据，提高研究效率、减少...

0 阅读 1.2k
V · 2024年03月07日

LLM 加速技巧：Muti Query Attention

MQA 是 19 年提出的一种新的 Attention 机制，其能够在保证模型效果的同时加快 decoder 生成 token 的速度。在大语言模型时代被广泛使用...

2 阅读 1.6k
超神经HyperAI · 2024年03月06日

两会进行时丨科技大佬点名 AI4S/人才培养/算力/大模型/行业通用数据集……

近日，第十四届全国人民代表大会第二次会议和中国人民政治协商会议第十四届全国委员会第二次会议，在北京相继开幕。一年一度的「两会时...

1 阅读 1.2k
V · 2024年03月06日

RNN又行了！DeepMind新发布的Griffin可以与同级别的LLM性能相当

Hawk和Griffin是DeepMind推出的新型循环神经网络（RNNs），2月刚刚发布在arxiv上。Hawk通过使用门控线性递归（gated linear recurrences...

4 阅读 1.1k
V · 2024年03月05日

使用纹理对比度检测检测AI生成的图像

大多数用于检测人工智能生成图像的深度学习方法取决于生成图像的方法，或者取决于图像的性质/语义，其中模型只能检测人工智能生成的人、...

2 阅读 1.2k
汀丶人工智能 · 2024年03月04日

结构化思维助力Prompt创作：专业化技术讲解和实践案例

对比什么技巧都不用, 直接像使用搜索引擎一样提问, 上面的技巧对于回复的效果确实有着明显提升. 在看了 N 多的所谓 “必看的 Prompt 10 ...

1 阅读 990
V · 2024年03月04日

Vision Transformers的注意力层概念解释和代码实现

2017年推出《Attention is All You Need》以来，transformers 已经成为自然语言处理(NLP)的最新技术。2021年，《An Image is Worth 16x1...

6 阅读 1.3k
汀丶人工智能 · 2024年03月01日

遇见您的私人法律顾问：智能法律大模型，智能解答您的法律困惑

为了让法律服务深入到每个人的身边，让更多的人能够得到法律帮助，开启了【律知】这个项目, 致力于打造一系列引领法律智能化的大模型。A...

1 阅读 1k
V · 2024年03月01日

可视化FAISS矢量空间并调整RAG参数提高结果精度

随着开源大型语言模型的性能不断提高，编写和分析代码、推荐、文本摘要和问答(QA)对的性能都有了很大的提高。但是当涉及到QA时，LLM通常...

4 阅读 1.5k
超神经HyperAI · 2024年02月29日

自主研发！军事医学研究院团队提出 MIDAS，可用于单细胞多组学数据马赛克整合

众所周知，细胞是生命体的最小组成单位，人体内含有 40-60 万亿个细胞，构成了我们生长、发育的基础，在单细胞层面开展研究对于精确理解...

1 阅读 1.4k

本月贡献榜

超神经HyperAI

贡献 95 声望

天罡智算杨旭颖

贡献 5 声望

关注极术微信号
实时接收点赞提醒和评论通知

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

关注安谋科技招聘
实时获取安谋科技中国职位信息

深度学习

标签文章

英伟达 2024 GTC 倒计时，黄仁勋会带来面向中国市场的新举措吗？

MADQN：多代理合作强化学习

Prompt进阶2:LangGPT(构建高性能Prompt策略和技巧)--最佳实践指南

2024年3月最新的深度学习论文推荐

清华大学研究团队发布条件去噪扩散模型 SPDiff，实现长程人流移动模拟

从16-bit 到 1.58-bit ：大模型内存效率和准确性之间的最佳权衡

部署到 Adreno™ GPU

Prompt进阶系列1:LangGPT(从编程语言反思LLM的结构化可复用提示设计框架)

妇女节特刊 | 上海交大吴梦玥：用言语智能技术，为精神疾病开出第一张诊疗单

StarCoder 2：GitHub Copilot本地开源LLM替代方案

HyperAI超神经 x DT新材料丨AI技术在化学与材料科学科研中应用研讨会开启报名

LLM 加速技巧：Muti Query Attention

两会进行时丨科技大佬点名 AI4S/人才培养/算力/大模型/行业通用数据集……

RNN又行了！DeepMind新发布的Griffin可以与同级别的LLM性能相当

使用纹理对比度检测检测AI生成的图像

结构化思维助力Prompt创作：专业化技术讲解和实践案例

Vision Transformers的注意力层概念解释和代码实现

遇见您的私人法律顾问：智能法律大模型，智能解答您的法律困惑

可视化FAISS矢量空间并调整RAG参数提高结果精度

自主研发！军事医学研究院团队提出 MIDAS，可用于单细胞多组学数据马赛克整合

本月贡献榜

超神经HyperAI

天罡智算杨旭颖