国工数据大脑之单样本符号检验与实验室智能研发管理系统(LIMS)的融合应用
企业中生产管理系统MES和实验室管理系统LIMS经过了长时间的应用,积累了海量的数据,但这些海量MES数据、LIMS数据并不全是对企业有价值的数据。因此,让MES、LIMS中的海量数据通过合理筛选成为对企业有价值的大数据、即让MES和LIMS系统中的大数据产生关联性及更大的额外价值,进而进行数据分析和决策成为企业业绩增长的根本。而MES、LIMS的海量数据筛选、数据分析、数据决策需要大量的数据统计学、机器学习的知识,数据大脑与MES和LIMS等系统的融合应用可以有效降低应用难度。当测试的数据不是一个单向的期望值,不能用“越怎么样越好”来表述的时候,可以考虑用符号检验来测试。如果通过平均值来测试一组样品,在以平均值为参考时,很难评价这一组样品哪个好,哪个不好,因为即使存在个体差异很大的情况,也能和期望平均值接近。所以要用另外一种方式,把这一组样品数据,转换成“越怎么样越好”的思维模式,比如说越接近期望值越好,这个检验方式就是符号检验。 假设一位化工工程师想确定一组不锈钢样本中的平均锰含量是否等于18%,这位工程师随机选择了12个样本并测量了锰含量。
工程师执行了单样本符号检验,以确定平均锰含量是否不等于18%。
图1 样本数据
从数据大脑中的组件面板查找Excel读取组件,拖动到工作面板,配置资源、输出、文件路径、队列容量。图2 Excel读取组件配置
从数据大脑中的组件面板查找单样本符号检验组件,拖动到工作面板,配置输入、样本、检验中位数、队列容量。点击运行,从调试中查看结果。图3 单样本符号检验组件配置
图4 调试信息
根据结果可以看到数据中一共有12个样本,中位数为18.1。原假设的理想值为18,<18的有5个,>18的有6个,=18的有1个。由于p值为1(大于显著性水平0.05),因此原假设成立。将数据大脑单样本符号检验与国工实验室智能研发管理系统(LIMS)相融合,在检验实验样本时,能提高准确性,可以避免样本个体差异过大的情况,从而更加准确地判断出被检测样本是否符合期望标准。使用单样本符号检验组件可以估计总体中位数并将它与目标值或参考值进行比较。使用此分析,可以执行以下操作:
1.确定总体中位数是否不同于您指定的假设中位数。
2.计算可能包括总体中位数的值范围。
为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则:
1. 数据不来自对称分布。
2. 数据不必是正态分布的。
3. 样本数据应该是随机选择的。
4. 每个观测值都应当独立于其他所有观测值。