2025 年 5 月底,沉寂已久的 Black Forest Labs 发布了新模型 FLUX.1 Kontext,并于近日宣布开源。其基于流匹配架构,支持上下文内图像生成,可以同时使用文本和图像进行提示,并无缝提取和修改视觉概念,从而生成新的、连贯的图像。从功能的角度来看,FLUX.1 Kontext 能够在无需复杂描述的情况下实现多种编辑任务,包括...
7 月 5 日,由 HyperAI 超神经主办的 Meet AI Compiler 技术沙龙第 7 期如约而至。虽是盛夏酷暑,依旧挡不住大家的热情——现场座无虚席,不少小伙伴甚至全程站着听完每一场分享。来自 AMD 、沐曦集成电路、字节跳动、北京大学的多位讲师轮番登台,从底层编译到实际落地,带来了深刻的行业洞察与趋势分析,干货满满!
近年来,生成式 AI 技术在图像领域取得显著突破,如 Stable Diffusion 系列、 DALL-E3 等模型通过扩散模型实现了高质量文本到图像生成。然而,这些模型缺乏视觉生成通用模型所需的全面感知理解和生成能力。 OmniGen 应运而生,基于扩散模型架构,为各种生成任务提供统一的解决方案,具备多任务处理能力,无需额外插件即...
这厢,AI 审稿人上岗,席卷多类期刊甚至顶会;那厢,作者开始在论文中插入隐藏指令,引导 AI 给好评。所谓「上有政策下有对策」,这究竟是利用 AI 审稿漏洞的学术作弊,还是以彼之道还施彼身的正当防卫?在论文中设置隐藏提示词固然有错,但 AI 审稿是否就完全无责呢?
近年来,青少年肥胖问题日益严峻,已演变为一场全球公共卫生危机。据报道从 1990 年到 2022 年间,全球 5 岁至 19 岁儿童和青少年中的肥胖人数增加了约 3 倍。通过科学的运动方式帮助青少年健康减重、更加阳光、培养终身受益的运动习惯,已成为当前全球公共卫生领域的重要议题。
一项名为「蛋白质结构预测关键评估(Critical Assessment of protein Structure Prediction)」的竞赛面临停办风险——正是那个 AlphaFold 亮剑夺魁的行业风向标大赛 CASP 。
超材料是一类由人工设计的亚波长结构组成的材料,能够突破天然材料的固有限制,实现对电磁波的精确调控,如负折射率、超透镜、隐身技术等。其中,机械超材料作为一类拥有特殊力学性能的人造材料,在航空航天、生物医药、能源存储等多个领域展现出巨大的应用潜力。其独特之处在于性能并非由材料的化学成分决定,而是通过...
现代医学诊断与研究高度依赖医学影像的解读与生成,从 X 光片的病灶识别到 MRI 向 CT 的图像转换,每一个环节都对 AI 系统的多模态处理能力提出了严苛要求。然而,当前医疗视觉语言模型(LVLMs)发展面临双重瓶颈:一方面,医疗数据的特殊性导致大规模高质量标注数据稀缺,公开可用的医学影像数据集规模通常仅为通用数据...
蛋白质作为生命活动的主要承担者,在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来,生命科学对蛋白质复杂特性解析的需求日益迫切,大数据、深度学习、多模态计算等技术的突破性发展,为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质...
卫星图像是通过卫星遥感技术获取的地球表面影像,它通过建立「太空视角」将地球信息数字化,实现了大范围检测、动态追踪和数据支撑。在人们的日常生活中,无论是宏观的环境治理还是微观的城市生活都已离不开它,比如在林业监测中,通过卫星图像可以快速圈定森林分布范围,计算不同林种覆盖比例,检测因砍伐、种植、病虫...
众所周知,视频编辑难度极高,若想要调整或替换主体,变换场景、色彩或是移除一个物体,往往意味着无数帧的手动标注、遮罩绘制和精细调色。即使是经验丰富的后期团队,也很难在复杂场景中保持编辑内容的时间一致性。近年来,随着生成式 AI 的快速发展,诸如「一键消除」等功能逐渐出现在各类剪辑软件中,令人们看到了 AI...
谷歌 DeepMind 的 Alpha 系列再添新成员——AlphaGenome,其能够更全面、准确地预测人类 DNA 序列中单个变异或突变,如何影响一系列调控基因的生物过程。
随着人工智能技术的不断深入成熟,AI 也赋予了医疗领域一场深刻的变革——通过整合多源数据与智能算法,为医疗行业的效率提升、精准诊断都提供了全新解决方案。医疗数据作为大模型的「燃料」,也是医疗决策的核心载体,它的角色至关重要,尤其是在中国医疗体系加速数字化转型的背景下,从数据角度解析医疗模型更是创新的必...
众所周知,人体由不同类型的细胞组成——免疫细胞在感染发生时可引发炎症反应以抵御病原体;干细胞具有分化潜能,可生成多种组织类型;而癌细胞则通过逃避生长调控信号,实现异常增殖。尽管这些细胞在功能和形态上差异巨大,但它们几乎都拥有相同的基因组。细胞的独特性并非来自 DNA 序列本身的差异,而是源于它们如何调控...
在人工智能技术突飞猛进的当下,大型视觉-语言模型(LVLMs)正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域,这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持,已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域,LVLMs 通过对 TB 级文本语料的学习,在机器翻译、文本...
6 月 13 日,全球计算机视觉三大顶级会议之一 CVPR 2025 公布了最佳论文等奖项。根据官方数据,CVPR 2025 共收到了超 4 万名作者提交的 13,008 篇论文,相较去年的投稿数量增长了 13%,大会最终接收论文 2,872 篇,整体接受率约为 22.1% 。
水泥生产是全球温室气体(GHG)排放的主要来源之一,其排放量占全球人为 GHG 排放的 6% 以上。这一环境负担主要源于水泥熟料的生产过程,包括高温(>950°C)煅烧石灰石(CaCO₃→CaO+CO₂)的化学反应,以及高能耗的工艺要求。随着全球基础设施需求的增长和人口扩张,据麻省理工团队论文介绍,预计到 2050 年水泥产量将...
在植物科学领域,长非编码 RNA(lncRNA)的研究正逐渐成为焦点。 2020 年发表的一篇关于植物 lncRNA 研究的论文指出,lncRNA 在植物的生长发育和环境适应过程中发挥着关键作用。例如,有研究发现,某些 lncRNA 能够通过与蛋白质相互作用来调控植物的开花时间,从而影响植物的繁殖策略。这种精细的调控机制对于理解植物如...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
计算材料科学作为现代材料科学领域的前沿研究方向,承担着解析材料微观结构与预测宏观性能的关键使命。该学科以第一性原理为基石,基于量子力学等基础物理定律,致力于精确预测真实材料的可实验测量性质,从而深入理解材料在外部刺激下的响应机制。这些响应特性涵盖线性、非线性及耦合效应,是决定电介质、铁电体、多铁...