大模型下最新的文章 - 极术社区 - 连接开发者与智能计算生态

大模型

ChatGPT，文心一言等大模型技术及应用

关注标签

关注数

0

内容数

693

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

爱笑的小姐姐 · 2024年04月03日

图解大模型计算加速系列之：vLLM核心技术PagedAttention原理

大家好，今天想来介绍下当红推理框架vLLM的核心技术PagedAttention。PagedAttention的设计灵感来自操作系统的虚拟内存分页管理技术。vLL...

3 阅读 7.7k
极术直播小助手 · 2024年04月02日

极术干货|安谋科技Alex Shang：AI大模型时代的智能物联创新应用

本次公开课为极术社区2024年大模型系列第一场公开课，由安谋科技技术专家Alex Shang分享。公开课探讨了大模型及生成式AI出现对智能物联...

24 阅读 3.3k
爱笑的小姐姐 · 2024年04月02日

聊聊PyTorch的ZeroRedundancyOptimizer优化器

最近在调研 PyTorch 的一些 features，偶然发现了一些有意思的小细节，小小记录下心得。ZeroRedundancyOptimizer 优化器是 PyTorch1.10 ...

2 阅读 2.9k
极术小能手 · 2024年03月28日

安谋科技曾霖：高性能融合计算IP平台加速智能车芯发展 | 2024中国（深圳）智能网联汽车发展论坛

今日（3月28日），深圳市工业和信息化局与中国软件行业协会联合多家单位，在深圳宝安国际会展中心举办2024中国（深圳）智能网联汽车发展...

2 阅读 3.4k
爱笑的小姐姐 · 2024年03月28日

微软推出Mora，对标Sora，多项测评超越开源SOTA，效果接近Sora

“Mora: Enabling Generalist Video Generation via A Multi-Agent Framework”

14 阅读 2.1k
汀丶人工智能 · 2024年03月26日

大模型落地实战指南：从选择到训练，深度解析显卡选型、模型训练技、模型选择巧

在1950年代初期，人们开始尝试使用计算机处理自然语言文本。然而，由于当时的计算机处理能力非常有限，很难处理自然语言中的复杂语法和...

0 阅读 2.6k
科技云报到 · 2024年03月25日

重构销售话术和知识库，容联云找到了大模型的“钉子”

从ChatGPT诞生起，大模型在营销、客服等场景的落地就被予以众望。然而在经历了一年多的“百模大战”洗礼之后，人们发现无论是算力成本还是...

0 阅读 1.4k
汀丶人工智能 · 2024年03月25日

Prompt工程全攻略：15+Prompt框架一网打尽、学会提示词让大模型更高效

[大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning详情]([链接])

1 阅读 2.7k
HonestQiao · 2024年03月24日

【聆思大模型AI开发套件】基于CSK6-MIX的智能积木平台

聆思大模型 AI 开发套件（CSK6-MIX）不仅提供了完善的多模态大模型调用功能，还提供了丰富的本地外设接口，可以通过端侧结合大模型来实...

18 阅读 3k
IT蜗壳-Tango · 2024年03月22日

聆思大模型AI套件与智谱AI结合使用

前段时间拿到了一个AI套件的试用，最近正好赶上智谱也有免费TOKEN的活动，就打算看看两者结合起来效果如何。今天只是简单的一个流程上的...

0 阅读 1.6k
汀丶人工智能 · 2024年03月22日

Prompt进阶系列4:LangGPT(构建高性能Prompt实践指南)--结构化Prompt

结构化的思想很普遍，结构化内容也很普遍，我们日常写作的文章，看到的书籍都在使用标题、子标题、段落、句子等语法结构。结构化 Prompt...

0 阅读 1.4k
AI学习者 · 2024年03月21日

使用 Ollama AI 在本地 Raspberry Pi 运行大语言模型

于是我很想验证这个“说法”，所以我决定在我的 Raspberry Pi 4 上使用 Ollama 本地运行大语言模型。

2 阅读 4.9k
超神经HyperAI · 2024年03月20日

美国阿贡国家实验室发布生成式 AI 框架，加速 MOFs 创新

在工业化飞速发展的大环境下，地球正面临着一个严峻而急迫的问题一一过度的二氧化碳排放。二氧化碳就像是一层无形的厚茧裹住了人类赖以...

3 阅读 1.5k
爱笑的小姐姐 · 2024年03月20日

马斯克实现承诺，开源Grok-1！3140亿参数迄今最大，远高于ChatGPT 3.5!

北京时间3月18日早上，马斯克旗下 AI 初创公司 xAI 宣布，其研发的大模型Grok-1其大语言模型Grok-1已实现开源，并向公众开放下载。感兴...

3 阅读 1.5k
甴尐 · 2024年03月19日

【聆思大模型AI开发套件】调用自己的AIGC 打通stable diffusion 自己lora图片

1.板子发送post请求。stable diffusion webui 这边图片默认是512\\_512 .板子内存有限。需要flask 接收图片后进行一次缩放到240\\_240.(...

4 阅读 1.8k
爱笑的小姐姐 · 2024年03月19日

Mixtral 8x7B(Mistral MoE) 模型解析

本文特别鸣谢字节跳动 Crane佬解答了我对SWA的疑惑0 前言 1 Mistral 7B 模型 1.1 SWA(Sliding Window Attention)2 Mixtral 8x7B(MoE...

0 阅读 2.7k
超神经HyperAI · 2024年03月18日

警惕城市「慢性病」：中南大学柳建新教授团队，用 AI 预测未来 40 年的地面沉降风险

2023 年 5 月，天津市津南区八里台镇凤锦庭院的业主「胆战心惊」，从远处看，自己家 25 层高的楼房「好像歪了」。更让业主们恐慌的是，...

0 阅读 563
AI学习者 · 2024年03月14日

手把手教你在树莓派4B上运行LLaMA 7B模型

LLaMA全称是Large Language Model Meta AI，是由Meta AI研究人员发布的一个预训练语言模型。与最近爆火的ChatGPT相比，LLaMA架构更小，...

2 阅读 3.2k
爱笑的小姐姐 · 2024年03月14日

初识langchain

用计算机类比的话，在这套框架内，LLM扮演的是CPU的角色，langchain扮演的是主板，为其提供内存、磁盘等设备，使其完成更多复杂的功能。

0 阅读 1.6k
汀丶人工智能 · 2024年03月13日

Prompt进阶2:LangGPT(构建高性能Prompt策略和技巧)--最佳实践指南

左图右图 prompt 基本是一样的，差别只在提示工程这个词是否用中英文表达。我们看到，一词之差，回答质量天壤之别。为了获得理想的模型...

1 阅读 1k

上一页
1
…
23
24
25
26
27
…
下一页

本月贡献榜

极术直播小助手

贡献 10 声望

爱笑的小姐姐

贡献 5 声望

修志龙_ZenonXiu

贡献 5 声望

超神经HyperAI

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息