摘要:随着人工智能技术的突破,尤其是生成式AI的爆发式增长,中国智能算力产业已成为数字经济的关键引擎。2019年至2023年间,智能算力规...
引言:告别,无休的memcpy, memset软件优化。Three instructions are all you need
Ringbuffer(循环缓存)是软件中非常常用的数据结构之一, 在互联网应用、数据库应用等中使用广泛。处理器执行Ringbuffer的效率与其存储...
近期,zStorage分布式块存储系统在海光+麒麟+E810网卡环境下,使用FIO工具测试4K单并发随机读/写IO时,延迟达到4ms。而这里唯一的变量是...
Nsight Systems 是 NVIDIA 提供的一款系统级性能分析工具,可以帮助我们进行CUDA代码的开发优化以及模型代码的优化。