最近Gartner发布2024年十大战略技术趋势,AI显然成为其背后共同的主题。全民化的生成式人工智能、AI增强开发、智能应用......我们正在进...
*本文为麻省理工学院(MIT)学者罗鸿胤独家供稿,「甲子光年」经其授权后编辑发布。罗鸿胤是人工智能领域的青年科学家、MIT 计算机学与...
Receptance Weighted Key Value(RWKV)是pengbo提出的一个新的语言模型架构,它使用了线性的注意力机制,把Transformer的高效并行训练...
CogVLM 是一个强大的开源视觉语言模型(VLM)。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。
近年来,我国数字经济快速发展,作为数字经济的基础设施,新型数据中心建设也日益受到重视。中国智能计算产业联盟秘书长安静在近期举办的第...
现代的人工智能硬件架构(例如,Nvidia Hopper, Nvidia Ada Lovelace和Habana Gaudi2)中,FP8张量内核能够显著提高每秒浮点运算(FLOPS),...
OpenAI的开发者日活动后,GPTs模式引发了新一轮的AI热潮,开发者调用过分火爆,甚至导致OpenAI服务器一度宕机。随后,花式把玩GPTs的经...
大环类化合物是指由 12 个以上原子组成的小分子或肽。相较于其他小分子化合物,大环类化合物在结构和性能上有着诸多优势,也因此被视为...
近半年来如火如荼的「百模大战」让越来越多的终端厂商卷进来,机器人、音箱、手表、眼镜等硬智能硬件产品加持大模型能力,让产品快速接...
自动驾驶技术的发展依赖于感知、决策和控制系统的高效集成。传统的数据驱动方法和基于规则的方法在处理复杂驾驶环境和理解其他道路用户...
上面的图像,类型(A)显示了检索到的数据或文档回答查询的位置。LLM仅使用NLG从提供的数据中格式化答案。
近日, “2023英特尔客户端解决方案论坛”在珠海举行,此次论坛以“百岛城 百川归海有渠道,珠江口 珠联璧合领芯潮”为主题,英特尔分享了其...
集微网报道 (文/陈兴华)在生成式AI浪潮的强势席卷下,AI PC正成为整个行业发展焦点,这得益于产业链的技术升级以及端侧AI具备安全独立...
集微网消息,存储芯片近年来行情持续承压,虽然一直有触底的声音,但在今年上半年DRAM和NAND的价格仍在进一步下跌,直到Q3开始,DRAM和N...
集微网报道 (文/陈兴华)随着AI大模型成为新型智算基础设施,行业巨头在AI芯片赛道上打得愈发火热。近日,除了微软首次推出两款自研芯...
大语言模型带来的智能涌现,让人们意识到:强人工智能的时代真正来临。大语言模型与强化学习的结合让机器与人类的行为实现对齐,甚至体...
2022 年 11 月,ChatGPT 发布掀起 AI 狂潮。时隔 1 年,2023 年 11 月,ChatGPT 之父、Sam Altman 的一项人事巨变,再次掀起了一场 AI ...
国内手机厂商都纷纷宣布将大模型应用于手机。基于大模型的AI能力,成为手机市场新的价值增长点,也将主流厂商推向新的起跑线。
科学发现是一个复杂过程,涉及到几个相互关联的阶段,包括形成假设、实验设计、数据收集及分析。近年来,AI 与基础科研的融合日益加深,...
开源最彻底的大模型来了——130亿参数,无需申请即可商用。不仅如此,它还附带着把全球最大之一的中文数据集也一并开源了出来:600G、1500...
在过去的一年里,大型语言模型(llm)有了飞速的发展,在本文中,我们将探讨几种(量化)的方式,除此以外,还会介绍分片及不同的保存和压缩...
“电影《速度与激情》中控制无人驾驶车辆轰炸建筑的事情,现实中会出现吗?”近日,在安谋科技“山海”S20F SPU新品发布会上,这个问题被提...
之前玩内测版的时候就需要cuda-12.x,正式出来仍是需要cuda-12.x,主要是因为tensorr-llm中依赖的CUBIN(二进制代码)是基于cuda12.x编...
近期, OpenAI 的开发者大会迅速成为各大媒体及开发者的热议焦点,有人甚至发出疑问“向量数据库是不是失宠了?”
近来,模组厂商第三季度报相继出炉。自22年开启模组界的内卷升级赛以来,各家厂商都开始从赛道扩容、产品升级、加大研发等多方面来提振...
计算机出现最初的主要用途就是提供计算。伴随着计算任务加重,人们对算力的需求越来越高,需要构建大型的数据中心才能满足计算需求。
10月1日晚上9点,“HKT x FWD 2023 年国庆烟花汇演”在维多利亚港上空上演。在23分钟时间里,燃放了超过3万枚烟花。而与以往维港烟花秀不...
关于 Pico 裁员的消息为整个 VR 行业蒙上了冷色调。而 AR 相比 VR,尽管目前在设备销量上还并不在一个量级,但 AR 的热度却不减,甚至趋...
ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型,在保留了前两代...
生成预训练Transformer模型,也称为GPT或OPT,通过在复杂语言建模任务中取得突破性性能而脱颖而出,但也因其庞大的规模而需要极高的计算...