智能研发管理系统是先进的实验室检验及研发项目管理工具,但目前市面上的系统都只是处于信息记录层面,而国工实验室智能研发管理系统融合了国工智能数据大脑平台MAI,平台内提供上百种统计学相关算法及机器学习算法。通过这些算法对实验数据进行分类分析、聚类分析、关联分析、预测分析等方式,挖掘数据潜在价值,探索人力无法探知的规律,真正实现提高企业产品附加值及行业竞争力,助力企业快速发展。
国工实验室管理系统LIMS和智能研发系统DPM,是国工智能制造管理平台(MES-MOM)的一部分。他们都以数据大脑平台为底层支撑,来提供算法支撑。
主成分分析(Principal Component Analysis,PCA)是一种统计方法。在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
某化工研发实验室在研发新产品工艺配比时,采用不同的原料A数量、原料B数量、添加剂数量、温度、反应时长、转速、电流、电压等条件进行多次实验,实验数据如下表所示,现需了解那些因素才是影响实验结果的真正因素,从而降低数据维度,确定这些因素以多大占比组合起来能够解释实验结果90% 的数据变异。
实验数据
通过上图的系统分析结果,可知第一个主分量 (PC1) 占总方差的44.3%(0.443 * 100%),而累积第四个主分量时,数据变异为90.7%(0.907 * 100%),前四个主分量即可推动数据的90%变异。 在PC1中,原料B、添加剂、温度、电流这4个因素占44%,随着这4个值的增加,PC1主分量的值也会随之增加; 在PC2中,原料A、添加剂、时长、电压这4个因素占较大比例26%,随着这4个值的增加,PC2主分量的值也会随之增加; 在PC3中,原料A、时长、转速、电流这4个因素占13%,随着这4个值的增加,PC3主分量的值也会随之增加; 在PC4中,时长、转速、电流、电压这4个因素占6%,随着这4个值的增加,PC4主分量的值也会随之增加。 国工数据大脑平台可直接获取实验室智能研发管理系统中的实验数据并将其对接到创建好的主成分分析模型中,根据得出的实现数据自动对数据进行降维,并将降维后的结果通过邮件等自动推送给相关领导,方便数据的下一步分析使用。 输入:自定义的主成分分析输入数据模型 输出:系统内置的主成分分析输出数据模型 项目:选择需要进行分析的特征向量(因素) 矩阵类型:特征分析结果显示的类型(相关矩阵、协方差矩阵) 当样本数据成千上万时,维数上千时,PCA是非常有效的一种降维方法,它能起到的作用有两个:一个是节约存储空间,当数据量过多时,通过减少几个维度就可以节约很多空间;另一个是提供计算的速度,将数据降维后,无论是样本数据训练时,还有对新数据做出响应时,速度都会大幅提高。 识别数据特征,经过降维后的数据能有效的保存大部分的特征数据,去除杂质数据。与实验室智能研发管理系统(LIMS)相融合