news新闻资讯

新闻资讯
国工数据大脑之判别分析(DiscriminantAnalysis)与设备管理系统的融合应用
READING
前言

 近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。国工智能实验室管理系统融合了国工智能数据大脑平台,平台内提供上百种统计学相关算法及机器学习算法;通过这些算法对企业数据进行聚类分析、关联分析、预测分析,挖掘数据潜在价值,探索人力无法探知的规律,提高企业产品附加值及行业竞争力,助力企业快速发展。本次案例就判别分析(Discriminant Analysis)与设备管理系统相融合进行探讨及应用举例。

READING
含义

判别分析是一种分类模型,它通过在k维空间选择一个投影超平面,使得不同类别在该超平面上的投影之间的距离尽可能近,同时不同类别的投影之间的距离尽可能远,在LDA中,我们假设每一个类别的数据服从高斯分布,且具有相同协方差矩阵Σ。此外,由LDA会将k维数据投影到k-1维的超平面,因此也具有dimension reduction的作用。不同于PCA会选择数据变化最大的方向。

READING
案例和提供数据

 某企业现需要对新来的180台设备根据型号进行分类,并记录了每台设备的需要的参数。

15.png

图1 数据准备

READING
分析过程

 首先配置读取组件然后从数据大脑中的组件面板查找判别分析组件,拖到到工作面板,配置数据,判别分析组件参数,点击运行。

16.png

图2 读取组件配置

再通过拖拽的方式将判别分析组件与Excel读取链接到一起。使用集成好算法的判别分析组件进行数据分析处理,对组件参数进行设置。

17.png

图3 判别分析组件配置

READING
分析结果

18.png

19.png

图4 数据分析结果

“分类汇总”表显示由模型正确归入其实际组的观测值比率。设备管理人员使用这些结果来查看模型如何准确地对设备进行分类。总体来看,93.9% 的设备归入正确的型号。组 2 的正确归入比率最低,60 台设备中只有 53 个(也就是 88.3%)归入正确的型号。
“误分类观测值汇总”表显示观测值应归入哪个组。设备管理人员使用这些结果来查看对哪些设备进行了误分类。例如,设备 4 应归入组 2,但错误地归入到了组 1。
“分类汇总”表的列 2 显示 53 个观测值已正确分配到组 2。但是,来自组 2 的 5 个观测值置入到组 1,来自组 2 的 2 个观测值置入到组 3。因此,来自组 2 的观测值中的 7 个观测值错误地分类到了其他组。
“误分类观测值汇总”表显示观测值 65、71、78、79 和 100 误分类到了组 1,而不是组 2,这是最常发生的误分类。
READING
与设备管理系统相融合

 国工数据大脑平台可直接获取设备管理系统数据,直接将设备数据对接到创建好的判别分析模型中,根据得出的分析结果自动对报告进行判定,代替人工判定。对设备根据型号进行相应的归类。

READING
适用范围

1.对设备进行分组。
2.对指定的设备进行相应的型号分组。

图片

END


电话
产品
二维码
首页