近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。国工智能实验室管理系统融合了国工智能数据大脑平台,平台内提供上百种统计学相关算法及机器学习算法;通过这些算法对企业数据进行聚类分析、关联分析、预测分析,挖掘数据潜在价值,探索人力无法探知的规律,提高企业产品附加值及行业竞争力,助力企业快速发展。本次案例就判别分析(Discriminant Analysis)与设备管理系统相融合进行探讨及应用举例。
判别分析是一种分类模型,它通过在k维空间选择一个投影超平面,使得不同类别在该超平面上的投影之间的距离尽可能近,同时不同类别的投影之间的距离尽可能远,在LDA中,我们假设每一个类别的数据服从高斯分布,且具有相同协方差矩阵Σ。此外,由LDA会将k维数据投影到k-1维的超平面,因此也具有dimension reduction的作用。不同于PCA会选择数据变化最大的方向。
某企业现需要对新来的180台设备根据型号进行分类,并记录了每台设备的需要的参数。
图1 数据准备
首先配置读取组件然后从数据大脑中的组件面板查找判别分析组件,拖到到工作面板,配置数据,判别分析组件参数,点击运行。
图2 读取组件配置
再通过拖拽的方式将判别分析组件与Excel读取链接到一起。使用集成好算法的判别分析组件进行数据分析处理,对组件参数进行设置。
图3 判别分析组件配置
图4 数据分析结果
国工数据大脑平台可直接获取设备管理系统数据,直接将设备数据对接到创建好的判别分析模型中,根据得出的分析结果自动对报告进行判定,代替人工判定。对设备根据型号进行相应的归类。