历经多个业务系统的构建,我深感 Anthropic 的《Build effective agents》一文与自身实战经历高度契合。本文在详解工作流与 Agent 的技术选型标准、设计模式应用及实施要点的同时,也融入了我的实战心得与实践经验总结。无论您正考虑构建工作流系统还是 Agent 系统,都能在此找到适合场景的最佳实践方案。特别值得关注的...
在 Linux 系统中,实际上所有的 I/O 设备都被抽象为文件这个概念,一切皆文件(Everything is File)。无论是磁盘、网络数据、终端,还是进程间通信工具(如:管道 pipe)等都被抽象为文件的概念。 这种设计使得 I/O 操作可以通过统一的文件描述符(File Descriptor, FD)来管理。 在了解多路复用 select、poll、epoll ...
作为非算法同学,最近被 Cursor、DeepSeek 搞的有点焦虑,同时也非常好奇这里的原理,所以花了大量业余时间自学了 Transformer 并做了完整的工程实践。希望自己心得和理解可以帮到大家~
OpenAI 官宣全面支持 MCP 协议,至此 MCP 已得到业界广泛的认可。正逐步成为 AI 应用架构的基础协议。做为 AI 应用架构的 USB-C,MCP 原理是怎样的?对实际业务又有何影响呢?本文以 MCP 原理解读及业务实践为切入点,探索 AI 应用架构在业务领域落地的路径。
通信协议是 AI Agent 加速落地的核心基础设施之一。Anthropic 推出的 MCP 已逐步确立其作为 AI Agent 连接外部工具的标准协议地位,而 Google 最新发布的 A2A 则聚焦于打破智能体协作壁垒,推动跨 Agent 协同体系的构建。作为 AI Agent 时代最受关注的两大通信规范,它们的安全性直接关乎 AI Agent 的安全边界,任何安全...
他不仅是 Django 框架的联合创始人,几乎每一位开发者,都用过他写的 Django Web 框架(全球超过 60%的 Python Web 应用基于此框架开发),还是创造了开源工具 Datasette,在 github 上拿下 9.9k star 的优秀开源者。
MCP 协议通过标准化接口实现 AI 模型与外部工具的无缝连接,而 Serverless 架构提供弹性计算资源,两者结合可解决 AI 代理的动态资源需求。例如,企业内大量 AI 智能体(如千人规模)的实时调度,可通过 Serverless 函数动态部署 MCP 服务器,按需扩展计算能力。这种模式尤其适用于低频但需快速响应的场景(如临时视频处...
目前各种 MCP 的文章和实际例子以及开源工具层出不穷,本文试图用最简单的方式解释下 MCP 解决什么问题和 MCP 怎么写的问题。
“你买的 4090 多少钱?”、“H100 性能真厉害!” ,GPU 的价格性能一直是大家乐于谈论的话题,作者也经常可以在茶余饭后听到这样的讨论。在热火朝天地谈论性能指标、价格以外,本着”知其然也要知其所以然“的道理,作者学习整理了 GPU 本身的工作原理,编程模型,架构设计,在这里将我的学习笔记整理成文与大家分享,希望与...
团队介绍:专注 AI 编程场景下的安全研究与解决方案,让 AI 输出的每一行代码,都经得起安全考验。
2025 年了,你使用过 AI 编程工具吗?近期 Cursor 在圈内圈外越来越火,加之我又用它实现了个工具,也跟周围人“科普”过,觉得还是值得写篇文章再介绍一下,让非技术同学也知道可以尝试开发一些小工具、小程序或小应用。
最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,它已经深刻地影响了“编程”领域,且正在各个领域迅速渗透。与此同时,普通开发者也变得非常地焦虑,因为实实在在感受到了它强大的威力,担心哪天自己就被取代。与其担忧,我们不如主动拥抱这种技术变革。
随着 DeepSeek R1 等开源大模型的火爆,越来越多的开发者、企业甚至开始尝试在本地部署大语言模型,享受 AI 带来的便利。然而近期腾讯混元安全团队-朱雀实验室发现:这些广受欢迎的 AI 工具中有不少存在安全隐患。如果使用不当,攻击者可能窃取用户数据、滥用算力资源,甚至控制用户设备。在见证行业多个 AI 系统因安全...
导语自 DeepSeek R1 技术报告 🐳 开放以来,开源社区涌现了多种「复现」工作。本 R1 复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索 R1/R1-zero 中强化学习步骤带来的模型效果提升,并尝试展望 R1 技术在未来模型训练与业务落地上的前景
在数字化浪潮的推动下,AI 大模型以其卓越的自然语言处理能力和智能交互特性,迅速在很多领域中占据了重要地位。比如:与传统客服相比,AI 大模型展现出了无可比拟的优势,通过精心设计的 prompt,能使我们在客服托管、智能客服等多个项目和业务场景中发挥显著作用,大幅提高工作效率,优化成果质量。为了精进个人能力以...
在今年的春节期间,DeepSeek 火出了圈。凭借 DeepSeek-V3 与 DeepSeek-R1 的创新技术和卓越表现,DeepSeek 迅速成为了行业内外的焦点。不管是技术专家还是普通用户,都对 DeepSeek 赞不绝口。我们特别准备了这篇技术科普文章,期望无论你是不是技术同学,都能够读懂 DeepSeek。
系统介绍mbp pro一、Ollama 安装与配置1.1 跨平台安装指南Ollama 作为本地运行大模型的利器,支持三大主流操作系统: {代码...} 1.2 服务验证 {代码...} 出现上述则表示安装成功,可浏览器访问 [链接]验证二、Deepseek 模型部署2.1 模型下载与加载以 deepseek r1 模型为例:访问[链接],默认为 7b 模型,如需其他模型,...
本文关注 DeepSeek-R1 在技术上最重要的突破——用纯深度学习的方法让 AI 自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。
自 “Prompt 工作手册” 发布以来,我持续研究大模型能力的应用及研发方法,结合产业发展,在研发框架和模型应用上有了新的思考,并形成了新的方法论,希望我们的能力不仅仅停留在模型研发的某一阶段,而能贯穿在研发全流程之上。本文介绍了我们近半年的工作成果,通过对研发框架的工程化,我们大幅降低了模型应用研发的成...
2024 年 1 月,腾讯朱雀实验室和腾讯安全科恩实验室,联合清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室 OpenCompass 团队发布行业首个网络安全大模型评测平台 SecBench:[链接]