大模型下最新的文章 - 极术社区 - 连接开发者与智能计算生态

大模型

ChatGPT，文心一言等大模型技术及应用

关注标签

关注数

0

内容数

693

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

腾讯技术工程 · 2月19日

大模型 Prompt 技巧全解析

在数字化浪潮的推动下，AI 大模型以其卓越的自然语言处理能力和智能交互特性，迅速在很多领域中占据了重要地位。比如：与传统客服相比，...

1 阅读 1.8k
天翼云开发者社区 · 2月19日

解锁DeepSeek深度应用，天翼云GPU云主机强势破局！

在人工智能重塑世界的当下，一场影响深远的科技变革正在悄然上演，DeepSeek系列模型在诸多领域掀起热潮。企业级AI模型的训练与部署，不...

0 阅读 286
超神经HyperAI · 2月18日

在线教程丨3款声音克隆模型真实测评，GPT-SoVITS精准拿捏「石矶娘娘」特点

春节档电影「哪吒 2」的票房一路高歌猛进，现已突破 120 亿，成为中国首部票房达到百亿大关的影片，已成功跻身全球影史票房榜前 10。影...

1 阅读 1.7k
天翼云开发者社区 · 2月18日

数字先锋 | 央企首批！天翼云助力中国石化率先完成全尺寸DeepSeek国产化部署！

自2025年春节以来，DeepSeek的全新开源推理模型在全球范围内迅速走红，成为各界关注的焦点，同时引发国产AI发展浪潮。众多国内企业相继...

0 阅读 368
天翼云开发者社区 · 2月17日

DeepSeek-R1满血版性能飙升四倍，成本大降，竟是因为……

近日，天翼云DeepSeek模型推理技术迎来重大升级！该技术不仅支撑DeepSeek-R1满血版模型实现性能的四倍提升，更将大规模部署模型的成本降...

0 阅读 344
超神经HyperAI · 2月14日

推理速度提升 1.7 倍，vLLM v1 版本发布！首个多模态逐步推理基准 VRC-Bench 上线

上个月，在大模型推理需求激增的背景下，AI 大模型推理框架 vLLM 正式迎来 v1.0 版本，相比之前版本，计算效率显著优化，API 设计更加稳...

0 阅读 682
超神经HyperAI · 2月14日

立志实现生物学领域首个AGI！医疗AI公司Owkin构建世界上最大癌症空间组学数据集

医疗 AI 并非新鲜话题，但近日方舟投资首席执行官兼投资总裁凯西·伍德 (Cathie Wood) 的表态再次点燃市场热情。在她看来，医疗保健是当...

0 阅读 534
爱笑的小姐姐 · 2月14日

SGLang DP MLA 特性解读

我的课程笔记，欢迎关注：[链接] 。这里简要解析了一下 SGLang v0.4 版本中针对 DeepSeek 模型引入的 MLA Data Parallelism Attention ...

0 阅读 2.3k
极术小姐姐 · 2月14日

软硬协同优化，安谋科技新一代“周易”NPU实现DeepSeek-R1端侧高效部署

近日，搭载安谋科技最新一代“周易”NPU处理器的硬件平台成功运行DeepSeek-R1系列模型，性能卓越、成本优异，为用户带来了更高效、便捷的A...

16 阅读 1.4k
超神经HyperAI · 2月13日

入选AAAI 2025！中国地质大学等提出图像分割模型ConDSeg

医学图像分割是医学影像处理领域中关键而复杂的一步，主要是通过将医学图像中具有特殊含义的部分分割提取出来，从而可为临床诊断、康复...

0 阅读 1.6k
天翼云开发者社区 · 2月13日

四大核心优势，多场景覆盖，息壤智算一体机-DeepSeek版强势来袭！

报！天翼云又有大动作！继打造“息壤”+DeepSeek王炸组合之后重磅推出息壤智算一体机-DeepSeek版再次打造爆款神器解锁AI黑科技的神秘力量...

0 阅读 457
爱笑的小姐姐 · 2月12日

推理模型新路线开源！与 DeepSeek 截然不同，抛弃思维链不用人类语言思考

抛弃长思维链和人类的语言，直接在连续的高维潜空间用隐藏状态推理，可自适应地花费更多计算来思考更长时间。

0 阅读 691
超神经HyperAI · 2月11日

高熵合金新发现！多团队联手实现抗氧化性高精度预测，增加铝/铬/硅含量可有效改善

涡轮叶片作为飞机发动机中最重要的部件之一，需要在超过 1000℃ 的高温下持续工作，同时承受巨大的机械应力。2018 年，美国西南航空的一...

0 阅读 498
徽州骆驼 · 2月11日

大语言模型上车应用-车载智脑

大语言模型在汽车行业的最大用途（如果不是之一的话）是让人类像控制马一样控制车辆。让车辆变成能听懂人话的灵性智能体。

10 阅读 904
爱笑的小姐姐 · 2月11日

浅析主流 Alignment 算法与 NeMo-Aligner 框架

今年 10 月在费城开 COLM 的时候，我有幸见到了 NVDA 两篇工作的 post，一篇是 RULER，现在已经是 long context 几乎必测的 benchmark；...

0 阅读 1.1k
超神经HyperAI · 2月10日

AlphaFolding填补蛋白质动态结构预测空白！复旦大学等提出4D扩散模型

蛋白质的功能很大程度上取决于其 3D 结构。19 世纪中期，科学界普遍认为蛋白质结构是固定的、刚性的，类似「锁与钥匙」模型 (lock-and-k...

0 阅读 645
天翼云开发者社区 · 2月9日

国产AI生态新突破！“息壤”+DeepSeek王炸组合来了！

2025，国产AI火力全开！天翼云“息壤”深度适配DeepSeek-R1/V3实现“国产模型+国产算力+国产云服务”全产业链闭环打造国产AI新高度助力千行...

0 阅读 368
超神经HyperAI · 2月8日

房价预测/矿藏勘探/自然灾害预测……AI助力地球科学革新

地球科学作为一个高度跨学科的领域，正在经历一场由 AI 引领的重大变革。回顾 2024 年，研究人员在智慧城市建设、房价预测、海洋生态建...

1 阅读 659
爱笑的小姐姐 · 2月8日

MoE 之年的总结和 MoE 推理优化的一些认识

首先我会简单回顾下 2024 年的学习收获，然后我会聊一聊我在 SGLang 中度过的几个月业余开源开发的经历。无论是最近火遍全球的 DeepSeek...

0 阅读 2.4k
超神经HyperAI · 2月7日

【vLLM 学习】使用 CPU 安装

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。

0 阅读 1.8k

上一页
1
…
7
8
9
10
11
…
下一页

本月贡献榜

极术直播小助手

贡献 10 声望

爱笑的小姐姐

贡献 5 声望

修志龙_ZenonXiu

贡献 5 声望

超神经HyperAI

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息