衰老,从古至今困扰了无数仁人志士。无论是千古一帝秦始皇,还是雄才大略汉武帝,亦或者挥斥方遒唐太宗,这些伟大的帝王无一例外的都留...
本期以 Micron 的 DDR3 Model 为例,介绍模型如何下载和如何仿真,以及对模型中的各个文件进行解析。
在追求高效代码的路上,我们不可避免地会遇到代码的性能瓶颈。为了了解、解释一段代码为什么低效,并尝试改进低效的代码,我们总是要了...
[导读] 大家好,我是逸珺。 某日一好友,调侃我的笔名,说读起来好像“抑菌”!嗨,还真是,不管了,“抑菌”就“抑菌”吧。 写号以来,有小伙...
随着存储介质在 I/O 性能方面不断演进,存储软件占用的总事务时间百分比变得越来越大。提高存储软件栈的性能和效率至关重要。存储性能开...
本篇文章与2023年底尝试挖掘并探寻以chatGPT为代表的LLM和以AlphaGO/AlphaZero及当下AlphaDev为代表的RL思想的背后底层理论及形式上的统...
音频编解码的主要对象是音乐和语音,音频的编解码格式可分为无压缩的格式、无损压缩格式、有损音乐压缩格式、有损语音压缩格式和合成算...
不久之前,一位朋友跟我说,追了综艺《毛雪汪》之后,突然对许久不碰的电视有了兴趣。因为毛雪汪客厅里,好朋友一起用华为智慧屏 V5 系...
Text-to-SQL(或者Text2SQL),顾名思义就是把文本转化为SQL语言,更学术一点的定义是:把数据库领域下的自然语言(Natural Language,N...
2024-04-18 周四 20:00 开播 回顾中
根据国家卫生健康委员会发布的《卵巢癌诊疗指南(2022 版)》,我国卵巢癌年发病率居女性生殖系统肿瘤第 3 位,仅次于子宫颈癌和子宫体...
本期写的是一个 Github 上的开源项目,基于 Tang Primer 20K 开发板和高云 GW2A FPGA 的 DDR3 控制器 IP。
在本篇文章我们将详细讨论推测解码,这是一种可以将LLM推理速度提高约2 - 3倍而不降低任何准确性的方法。我们还将会介绍推测解码代码实...
AiStudio是一个很好的学习平台,我相信无时无刻都有很多像我一样的小白出于对人工智能的兴趣,而汇聚在这里。这一次,我想做一个入门级...
【导读】近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度提高了5...
华为作为中国自动驾驶技术第一梯队的卓越代表,其激光雷达产品也备受瞩目,不过关于华为激光雷达的公开资料非常少,即便是有也非常粗略。
AMBA总线是ARM研发的(Advanced Microcontroller Bus Architecture)提供的一种特殊的机制,可以将RISC处理器集成在其他IP芯核和外设中...
在摩尔定律事实上失效了以后,过往在单芯片上通过改善工艺制程来推高芯片性能的方式逐渐成为了过去式。取而代之的是各种先进封装技术,...
从历史维度看,全球半导体市场离不开一个词:周期。美国半导体行业协会(SIA)最新发布的数据显示,全球半导体2023年销售总额为5268亿美...
提到这个有些高大上的名词,大多数人的反应或许是,它们是属于政府机构和企业的事儿,跟个人的关系不大。其实,你我每天都会使用到的终...
世界是复杂的,没有人知道未来会怎样,但如果单纯从技术的角度,我们总是能够沿着技术发展的路径,找到一些主导未来趋势的脉络。
今年一月份,聆思极术社区启动的【免费试用】聆思大模型AI开发套件评测申请 活动受到了很多开发者小伙伴的关注,经过报名筛选最终有36位...
AI换脸,也称为“深度伪造”(Deepfake),是一种利用人工智能技术将人脸替换到另一个人的脸部上的技术。“深度伪造”技术涉及多种技术和算...
重点:• 全新 Arm Ethos-U85 NPU 性能提升四倍,为工厂自动化和商用或智能家居摄像头等高性能边缘 AI 应用提供有力的支持。• 全新 Arm ...
从Intel的率先入局,到三星、LG等企业闻风而入,以及日前苹果的看好信号,一系列密集的动作背后,用玻璃材料取代有机基板似乎正在成为业...
2024 年 2 月,OpenAI 又一次站在了镁光灯下,Sora 横空出世并引发热烈讨论,「文生视频」的热潮被那段 60 秒的展示视频再度推高,也使...
Arm Neoverse S3 是 Arm 专门面向基础设施的第三代系统 IP,应用范围涵盖高性能计算 (HPC) 、机器学习 (ML)、边缘和显示处理单元,是新...
一、前言二、RPC 基础概念三、protobuf 基本使用四、libevent五、实现 RPC 框架基本框架构思元数据的设计分析:客户端发送请求分析:服...
Memory consistency model又称Memory model (内存模型),定义了使用Shared memory(共享内存)执行多线程(Multithread)程序所允许的行为规...
FlashAttention(FA)是一系列针对Transformer模型训练和推理加速方案。自从去年(2022年)五月发布以来,历经了多次迭代,并借着其节省...