news新闻资讯

新闻资讯
国工数据大脑之有机合成预测在化学研发中的应用
READING
概述

目前人类虽然已掌握数以亿计的分子数量,但也只占未知分子数目的一小部分,阻挡化学家发现未知分子的一个重要因素是缺乏分子的合成路线,而有机合成能够为化学家们提供一种从简单结构分子破碎重组合成复杂的分子的方法。在有机合成领域早期主要依靠化学家累计的经验及制定的模板来进行合成实验,随着分子机器学习中的生成模型逐渐成熟,用数据驱动的方法应对有机合成的挑战成为当下化学产品研究及研发的重要手段之一。

随着人工智能技术日渐成熟,其在化学领域应用优势也逐渐展现出来,有机合成预测就是其中之一。在传统的化学实验室中,实验员想了解两种分子的产物,必须通过真实的化学实验才能得到结果。而借助国工数据大脑平台中有机合成算法,实验员仅通过简单的点击就可以得到两种分子反应的多条预测结果,以供相关人员进行参考。这不仅能够节省时间成本,同时还能够降低了相关的实验成本,及相关的实验风险。

READING
平台优势

国工数据大脑平台是一个集成人工智能算法、统计学算法的数据分析平台,服务于传统行业的智能化改造升级。经过多年的积累,国工数据大脑平台在数据、算法等方面具有明显的优势。针对于有机合成预测算法,其主要优势如下:

第一,集成于国工数据大脑平台,降低了该算法的使用门槛,使用者仅需输入参与反应的SMILES代码即可;具有较快的运行速度,可以快速响应用户的需求;

第二,建模数据规模庞大,主要得益于国工智能在化工行业深耕多年,慢慢积累得来;

第三,采用transformer AI技术框架进行训练,克服对既有经验以及模板库的依赖,同时拥有较高的预测准确率;

第四,数据、模型可信度高,每条数据均出自于相关专利文献,并且模型的预测线路均参考相关文献专利;

第五,多条预测线路展示,该算法可以为每个预测线路进行可靠性计算,并按照可靠性高低展示给用户。

READING
预测过程

 首先,打开国工数据大脑平台。依次进行操作:机器学习-->工作台—>新建正向合成计算流程—>拉取正向合成组件(图1)

23.png

图1

然后,进行组件配置。资源项选择正向合成云服务,分子式填入参与反应的相关反应的SMILES表达式,并按照相应规则填入,如图2所示。最后点击调试,当显示运行成功时即表示运行预测算法成功,平台会将预测结果展现给用户,结果如图3所示。

24.png

图2
READING

分析结果


25.png

  图3

如图3所示,数据大脑平台运行预测算法可以同时得到多条预测结果,以供实验人员进行参考。同时其排序顺序则是按照算法预测结果的可靠性计算后展示给用户。
其中每条结果都是由参与反应的反应分子的分子结构图及其SMILES表达式与预测生成物的SMILES的分子结构图及其SMILES表达式共同组成。分子结构图可以帮助实验人员快速的定位到发生反应的官能团,以及具体的化学键的断裂与重组的情况。依据以上信息以及其本身的经验,实验人员可以分析出分子间结合反应的合理性,并以此作为该反应是否保留进行真实实验的依据。通过使用国工数据大脑的正向合成服务,可以有效的帮助实验人员节省时间以及实验成本,加快研发的效率。是学术、研发人手必备的科研利器。
READING
名词解释

SMILES表达式:全称Simplified molecular input line entry system,是一种简化分子线性输入规范,一种用ASCII字符串明确描述分子结构的规范。

分子式填入规则:反应分子的SMILES表达式中间由“.”进行隔开。

READING
适用范围

 有机合成预测应用场景:各大化学研发中心的小分子研发实验室,以及各高校化学研究实验室。

图片

END


电话
产品
二维码
首页