集微网 · 2021年06月04日

【专利解密】人工智能模型助力百度探索新药物信息设计方案

【嘉勤点评】百度发明的药物预测方案,能够使得训练的药物预测模型的准确性更高,且可以有效地提高训练的药物预测模型的训练效果,从而为实验人员提供良好成药分子的药物信息设计方案。

集微网消息,近日,在首届中国生物计算大会上,百度创始人、董事长兼CEO,百图生科创始人兼董事长李彦宏表示,生物计算是一个高度融合的学科,生物+计算的融合,会带来巨大的突破和进步。依靠生物计算引擎,能够有效利用大量的生物数据,把药物发现的“大海捞针”变成“按图索骥”,为人类的生命健康谋福祉。

在实际的医药研发工作中,研究人员发现人类疾病的靶点通常是疾病发展中具有关键作用的蛋白质,亦可以称为蛋白质靶点。根据这个特点,药物通过和靶点蛋白质的结合来使得对应的蛋白质丧失原有功能,从而实现疾病的抑制作用。因此,在新药研发过程中,针对特定的蛋白质靶点,需要快速搜索药物的化合物空间,找到能够和蛋白质靶点进行结合的化合物,进而形成可以用于治疗的药物。

但是,传统方法中通常由有经验的专家对蛋白质靶点进行研究和估计,并且尝试设计可能的化合物,并对化合物与蛋白质靶点的亲和度进行估计和筛选。这种方式依赖于经验和运气,对于新药的发现有较大的不确定性。

为了提高新药的研发质量和效率,百度在2021年1月5日申请了一项名为“药物预测方法及模型的训练方法、装置、电子设备及介质”的发明专利(申请号:202110007460.7),申请人为北京百度网讯科技有限公司。

根据该专利目前公开的相关资料,让我们一起来看看这项方案吧。

image

如上图,为该专利中发明的基于人工智能的用于药物预测模型的训练方法,首先,系统获取训练靶点的药物数据集,再根据各个训练靶点的药物数据集,对药物预测模型进行训练。药物的预测模型包括有:特征处理模块、编码模块和解码模块。

特征处理模块可以把各个训练靶点的药物数据集中的药物的特征表达、药物与其对应的靶点的特征表达进行特征拼接,得到综合特征表达;再接着由编码模块对综合特征表达进行编码处理,得到编码后的特征表达;最后,在由解码模块解码并输出对应的训练靶点的预测药物的信息。

该专利中的方案在进行训练时,不仅包括训练靶点的药物的信息,还包括训练靶点与药物的亲和度,相比于传统只使用各个靶点的药物直接进行训练的模型,这种基于人工智能模型的方式可以有效提高训练的药物预测模型的训练效果。

image

如上图,为训练过程中药物数据的生成方法,首先基于预设靶点对应的药物数据集,采用预先训练的药物预测模型,生成预设靶点的预测药物的信息。其次,基于预测药物的信息和预设靶点,检测预测药物与预设靶点的亲和度,例如使用化学实验,分子模拟,或者建立AI模型的方式,检测预测药物与对应的训练靶点的亲和度。

最后,基于预测药物的信息以及预测药物的信息与预设靶点的亲和度,更新预设靶点对应的药物数据集。这种药物数据的生成方法由系统中的药物数据生成装置来执行,在生成装置中,可以实现生成预设靶点的药物信息,并更新对应预设靶点的药物数据集。

以上就是百度发明的药物预测方案,该方案能够使得训练的药物预测模型的准确性更高,且可以有效地提高训练的药物预测模型的训练效果。基于训练得到的药物预测模型,即可完成预设靶点的预测药物的信息预测,且可为实验人员提供良好成药分子的药物信息设计方案。

关于嘉勤

image

深圳市嘉勤知识产权代理有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。

(校对/holly)

推荐阅读
关注数
12739
内容数
1029
从专利出发,浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息