当下,生成式AI、大模型等创新技术迅猛发展,计算产业全面迈入数据驱动的新时代,并朝着更智能、高能效、更安全的低碳绿色计算方向发展...
2024年11月16-17日,大湾区国际创客峰会暨Maker Faire Shenzhen 2024将在深圳南山万科云设计公社举办。作为创客圈交流协作的大型盛会,...
2024年11月5-6日,国际集成电路展览会暨研讨会(IIC Shenzhen)将在深圳隆重举行。本次大会聚焦行业热点技术,精心策划了产业峰会、高端...
作为一款高性能的推理引擎框架,MNN*高度关注Transformer模型在移动端的部署并持续探索优化大模型在端侧的推理方案。本文介绍权重量化的...
下周,第十一届IoT大会、湾芯展SEMiBAY将在深圳拉开帷幕,在这2场行业盛会上,安谋科技的技术大咖将带来精彩的主题演讲。届时,他们将围...
🎯 本文目标:在星睿O6上运行智谱AI视觉大模型,测试GLM-Edge视觉系列和GLM-4V系列的多模态能力,验证ARM设备上的图像理解和分析功能。
🎯 本文目标:为llama.cpp和chatglm.cpp部署Web服务与OpenAI兼容API,构建完整的AI服务生态系统,实现真正的产品化部署,让星睿O6成为可...
🎯 本文目标:在星睿O6上部署CodeGeeX2实现智能代码生成,完成整个智谱AI全栈大模型生态系统的构建,让星睿O6成为真正的AI开发工作站。
🎯 本文目标:在星睿O6上基于chatglm.cpp框架运行智谱AI文本大模型,对比llama.cpp的性能差异,重点测试GLM系列模型在专用框架上的优化效...
🎯 本文目标:在星睿O6上基于llama.cpp框架运行智谱AI文本大模型,包括GLM-Edge系列、GLM-4系列和最新的GLM-4.6V-Flash模型,进行全面的...
🎯 本文目标:将chatglm.cpp环境部署到星睿O6开发板,专门针对GLM系列模型进行优化,在ARM设备上实现更高的运行效率和更低的内存占用。
🎯 本文目标:将llama.cpp环境迁移到星睿O6开发板,并针对ARMv9架构进行专门优化配置,充分发挥硬件性能。
🎯 本文目标:在PC上搭建chatglm.cpp推理环境,这是专为GLM系列模型优化的推理框架,在星睿O6上运行时内存使用更高效,对话体验更流畅。
🎯 本文目标:在PC上搭建llama.cpp推理环境,为后续模型格式转换和量化处理做准备。这是整个部署流程的第一步,为星睿O6上的大模型运行奠...
🎯 本系列文章的核心价值:经过深入研究和实践,在星睿O6 ARM开发板上成功部署了完整的智谱AI大模型生态系统,包括文本生成、视觉理解、...
O6 的 npu 具有约 30 TOPS 算力- 支持 INT4 / INT8 / INT16 / FP16 / BF16 / TF32 等计算精度
在Radxa官方文档Orion O6此芯 SDK获取源代码页面,提示“SDK 在容器内运行时可能会遇到权限问题,建议使用实体机或虚拟机进行编译”。但我...
本文以 YOLOv8-L 模型为例,系统讲解其从 ONNX 模型到 NPU 支持的cix格式的完整编译与推理流程。
本文记录了在 Orion o6 平台上,运行官方 cix_ai_model_hub 中的模型时的步骤以及碰到的问题,包括以下内容:
Windows11 Python3.11WSL Ubuntu 22.04O6 Debian UOE SDK 25Q3 (手动编译内核)
whisper.cpp 是一个基于 C/C++ 实现的轻量级开源语音识别库,旨在让 OpenAI 的 Whisper 模型能够在各种设备(包括嵌入式系统、边缘设备...
本文主要描述如何在 Radxa Orion O6 上使用 llama.cpp 部署 Deepseek R1 模型,包含以下内容:
用radxa的debian镜像,下载了[链接]尝试运行NPU demo报错:需要使用新版本npu kmd/umd运行
部署NPU需要申请CIX早鸟计划获取SDK非常感谢Molly提供的编译好的新版本Debian(Orz),Radxa目前提供的镜像无法使用25Q3的Cix SDK,需要...
瑞莎星睿 O6 (Radxa Orion O6) 是一款面向 AI 计算和多媒体应用的专业级 Mini-ITX 主板。它搭载 Cix P1 SoC(型号 CD8180),支持 最高 64...
近日,印度古尔冈地区的马内萨尔市政公司发布重要通知,宣布将在其管辖范围内的所有住宅区、集体住房综合体以及商业机构中,全面安装RFI...
今年5月,谷歌将“查找我的设备”更名为“查找中心”(Find Hub),并同步引入两项重要升级:卫星连接与超宽带(UWB)支持。
orion o6配瑞莎AI PC Case Kit,通过oculink线接到显卡坞+4060ti显卡
随着大语言模型(LLM)的迅速发展,AI 不再只是“会聊天”的工具,而是能够理解、推理并生成多模态内容的智能体。本文将基于Orion O6平台...
llama.cpp 必须 使用master版本,用老版本会有编译bug {代码...} 这是由于 {代码...} glslc在编译spv的过程中,使用FConvert 进行相同类...
本文介绍了瑞莎星睿 O6 (Radxa Orion O6) 开发板实现单个和多个数字识别、网页手写数字识别的项目设计,包括准备工作、环境搭建、MNIST ...
瑞莎星睿 O6 (Radxa Orion O6) 是一款面向 AI 计算和多媒体应用的专业级 Mini-ITX 主板。相信很多同学买来这个板子是用来做NAS或者家庭...
首先非常感谢极术社区和arm china提供的这次试用机会!目前,端侧 AI 部署已成为行业发展的重要趋势。随着大语言模型(LLM)和多模态模...
本文介绍了瑞莎星睿 O6 (Radxa Orion O6) 开发板结合 Haar 级联和 YuNet 模型实现人脸检测的项目设计,包括板端推理和动态检测,并通过 ...
你需要准备的几样东西一个闲置的 U 盘(用来制作系统安装盘)键盘,鼠标HDMI 线电源线以及电源下载系统镜像访问 Ubuntu 的 Arm 下载地址...