随着 AI 技术在我们日常生活中的广泛应用,模型的「可解释性」逐渐成为一个亟待解决的问题。尤其是在涉及人类生命、财产安全等任务时,...
在人类与疾病的漫长斗争中,药物研发一直是科学探索的前沿阵地。其中,小分子药物因其易制备、细胞渗透性强、口服便捷、制造成本低等优...
这几天尝试读懂 SGLang sever arguments 和 feature,其中非常重要的一环是 Chunked Prefilling。我直接用 Claude 和 GPT 来尝试理解这...
地球科学作为一个高度跨学科的领域,正在经历一场由 AI 引领的重大变革。通过在海量地球科学数据中挖掘潜在信息、发现隐匿模式等,AI 不...
众所周知,麻辣系统博大精深。今天浅浅捋一捋 SGLang 实现的后端/ Runtime 框架,前端部分留作后文。
你能想象自己看到、想到,甚至是梦到的画面被可视化出来吗?这并非天马行空的想象,早在 2008 年,美国加州伯克利分校神经系统科学家 Ja...
近年来,AI for Science 发展提速,不仅为科研领域带来创新研究思路,同时也拓宽了 AI 的落地通路,为其提供了更多具有挑战性的应用场景...
书接上文,今天起来后感谢合作者的点醒,大概发现了如何用 vllm 去 serve embedding model,并且成功利用 serve 了 gte-7b。
手写记录是许多人在日常生活中记录灵感的方式,但如何高效地将手写内容转化为电子文本一直是一大挑战。传统的 OCR(光学字符识别)技术...
Text Embedding 榜单:MTEB、C-MTEB 《MTEB: Massive Text Embedding Benchmark(海量文本嵌入基准)》 判断哪些文本嵌入模型效果较好,通...
11月15日,以“智算力,大模型,新经济”为主题的第六届中国超级算力大会(ChinaSC2024)在北京举办,六位院士携手数十位专家齐聚此次盛会...
然而晶体材料的生成和设计过程并不简单,通常需要同时考虑离散变量和连续变量的组合。其中离散变量定义了材料的基本框架(如原子类型和...
Megatron Sequence Parallelism:本质是想通过降低单卡激活值大小的方式,尽可能多保存激活值,少做重计算,以此提升整体训练速度,一般...
要说谁是引领蛋白质设计的世界级大师,美国华盛顿大学的 David Baker 教授可谓是当之无愧,作为该领域的顶级专家,Baker 在蛋白质方向发...
「传统研究方法高度依赖于科研人员自身的特征和问题定义能力,通常采用小数据,在泛化能力和拓展能力上存疑。而 AI 研究方法则需要引入...
以 ChatGPT、ChatGLM 和 LLaMA 等为代表的大语言模型已成为人们探索未知世界的有力工具,这些拥有数十亿参数的模型,通过大规模文本语料...
来源:[链接] 。下面文章包含2个主题,第一个是FSDP2中开启Float8 All-Gather的Discussion的翻译,第二个是TorchAO中的Float8实现速览的...
论文标题:Harmonizing Visual Text Comprehension and Generation 论文地址:[链接] 论文源码:[链接]
「开源能够确保世界上更多人从 AI 的发展中获得利益与机会」,扎克伯格曾在 Llama 3.1 发布时撰写长文,阐述了开源的意义。诚然,伴随 A...
随着大型语言模型(LLMs)参数的不断增加,数百亿甚至数千亿参数,对专用硬件加速器制造商产生了巨大压力,使后者的创新设计成为人工智...