人工智能下最新的文章 - 极术社区 - 连接开发者与智能计算生态

人工智能

人工智能（英语：Artificial Intelligence，缩写为 AI）亦称智械、机器智能，指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智能的技术。

关注标签

关注数

29

内容数

8515

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

V · 2025年02月10日

哪些特征导致过拟合？使用 ParShap 方法精准定位导致模型泛化能力下降的关键特征

当模型在训练数据上表现良好，但在测试数据上表现不佳时，即出现“过拟合”。这意味着模型从训练数据中学习了过多的噪声模式，从而丧失了...

0 阅读 660
企业存储技术 · 2025年02月10日

在 Azure MI300X GPU 虚机上运行 DeepSeek-R1

本文编译自 Azure High Performance Computing (HPC) Blog，原文标题《Running DeepSeek-R1 on a single NDv5 MI300X VM》。

5 阅读 1.4k
碎碎思 · 2025年02月10日

DeepSeek 接入到 VSCode 实现提词及代码助写

在 AI 大火之后，AI 代码一直是讨论的热题，之前比较火的 cursor 就是基于此出现的，但是国内访问受限，而且价格昂贵，我们今天就做个平...

4 阅读 2.9k
天翼云开发者社区 · 2025年02月09日

国产AI生态新突破！“息壤”+DeepSeek王炸组合来了！

2025，国产AI火力全开！天翼云“息壤”深度适配DeepSeek-R1/V3实现“国产模型+国产算力+国产云服务”全产业链闭环打造国产AI新高度助力千行...

0 阅读 500
超神经HyperAI · 2025年02月08日

房价预测/矿藏勘探/自然灾害预测……AI助力地球科学革新

地球科学作为一个高度跨学科的领域，正在经历一场由 AI 引领的重大变革。回顾 2024 年，研究人员在智慧城市建设、房价预测、海洋生态建...

1 阅读 832
V · 2025年02月08日

DeepSeek 背后的技术基石：DeepSeekMoE 基于专家混合系统的大规模语言模型架构

DeepSeekMoE 是一种创新的大规模语言模型架构，通过整合专家混合系统(Mixture of Experts, MoE)、改进的注意力机制和优化的归一化策略，...

2 阅读 2.2k
脑极体 · 2025年02月07日

DeepSeek破圈，AI商业化临界点是如何被打开的？

DeepSeek在这个春节假期卷翻了硅谷，我们注意到，对于模型和应用的讨论很多，但鲜有人追问：DeepSeek的现象级爆火，为AI商业化撕开了怎...

3 阅读 1.1k
超神经HyperAI · 2025年02月07日

【vLLM 学习】使用 CPU 安装

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。

0 阅读 3.7k
超神经HyperAI · 2025年02月07日

超导材料搜索效率提升5倍！佛罗里达大学等用深度学习变革材料发现，成果登Nature子刊

在科幻电影「阿凡达」中的潘多拉星球，那座被绿色藤蔓缠绕、悬浮于云端的哈利路亚山，无疑给观众留下了深刻的印象。其悬浮的奥秘，就在...

0 阅读 720
爱笑的小姐姐 · 2025年02月07日

DeepSeek-V3 FP8 量化浅析

DeepSeek-V3 横空出世，训练和推理成本极低，一个重要的原因就是采用了 FP8 进行训练和推理，今天结合最近的实践来分析一下其中的原理：

1 阅读 3.6k
V · 2025年02月06日

数据降维技术研究：Karhunen-Loève 展开与快速傅里叶变换的理论基础及应用

在现代科学计算和数据分析领域，数据降维与压缩技术对于处理高维数据具有重要意义。本文主要探讨两种基础而重要的数学工具：Karhunen-Lo...

0 阅读 829
超神经HyperAI · 2025年02月06日

开源1760亿参数通用医学语言模型！北邮/北大/三峡大学提出MedFound，推理能力接近专家医师

古话说，「人非圣贤，孰能无过」，但在医学领域，像误诊这样的「过」，造成的后果却可能是惨痛的。一方面对于患者而言，轻则虚惊一场，...

0 阅读 1.1k
vesperW · 2025年02月06日

利用 Deepseek 学习嵌入式技术，合适吗？

春节前后，DeepSeek 着实火了一把，朋友圈也是刷爆了（不知道你朋友圈有没有关于 Deepseek 的消息？）。

0 阅读 1.1k
超神经HyperAI · 2025年02月05日

【Triton 教程】triton.autotune

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU ...

0 阅读 1.4k
超神经HyperAI · 2025年02月05日

在线教程丨YOLO系列10年更新11个版本，最新模型在目标检测多项任务中达SOTA

YOLO (You Only Look Once) 是计算机视觉领域中最具影响力的实时目标检测算法之一，以其高精度与高效性深受业界青睐，广泛应用于自动驾...

0 阅读 1.3k
超神经HyperAI · 2025年02月05日

十宗「最」！2024 年 AI 大事件回顾，揭示隐藏风口与行业挑战

2024 年，AI 浪潮依旧凶猛地奔涌向前，未见颓势，悄然重塑着世界的轮廓，书写了一个个创纪录的革新性事件。

1 阅读 966
超神经HyperAI · 2025年02月05日

2025年的第一本书！马斯克/Sam Altman/比尔·盖茨等强推的AI领域必读书推荐

新年新目标，阅读伴成长2025 年的第一本书你选好了吗？HyperAI超神经精选了 10 本 AI 领域必读书籍用知识武装自己，在新的一年跑得更远吧！

0 阅读 2.1k
超神经HyperAI · 2025年02月05日

中文对联/十二生肖/城市景点/旅游计划……年味超浓的数据集汇总

正月初三，年味正浓。新春的喜庆氛围不仅弥漫在大街小巷，也在人工智能领域引发了诸多创新应用。从 AI 生成春联，到春运交通标志的智能...

2 阅读 621
V · 2025年02月05日

DeepSeek 技术报告解析：为什么 DeepSeek-R1 可以用低成本训练出高效的模型

DeepSeek-R1 通过创新的训练策略实现了显著的成本降低，同时保持了卓越的模型性能。本文将详细分析其核心训练方法。

11 阅读 2.6k
脑极体 · 2025年01月28日

穿过幻觉荒野，大模型RAG越野赛

2025年初，大模型赛场热度不减，有拼成本优势，拼Tokens调用量的短跑赛；有比慢思考，比大模型推理能力的长跑赛。但在观看这些“经典赛事...

0 阅读 1.1k

上一页
1
…
37
38
39
40
41
…
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息