
某企业工厂生产参数优化
《中国制造2025》提出了用信息化和工业化两化深度融合来引领和带动整个制造业的发展,让制造业向工业4.0转变。云计算和大数据是实现工业4.0的关键技术。在制造阶段,通过大数据技术发现生产过程的异常,提高产品的质量控制,对于优化生产,提高产能有着及其重要的意义。
实验列表
-
step1
-
step2实验2 数据预处理用Python语言实现数据的预处理查看详情
工业生产中,可以收集到三类数据:可控参数draft_data;不可控参数param_data;过程中监控的指标param_data_timevarying;以及关于质量指标:成品率key_index。
数据是以批次为单位进行记录。每一个批次都有:
一组可控参数(用Xd表示)
一组不可控参数(用Xp表示)
每个时间间歇(约1分钟)采集数百组监控数据(用Xt表示)
因为涉及数个产品的生产,可以得出一个质量指标的单个值,也就是成品率(用Y表示)
数据分为训练数据和测试数据。训练数据包括Xd, Xp, Xt和Y。利用训练数据找出数据见的关联和关系。测试数据和训练数据在格式和内容上一致,只是不含Y信息。
此项目需要完成2个任务:
预测Y:
利用Xd预测Y,即Y= f(Xd);
利用Xd, XP, Xt预测Y,即Y= f(Xd, XP, Xt),其中Xt为生产过程的监控数据;
列出三个最优的Xd
-
step3实验3 向RStudio读入数据我们需要将实验3中准备好的数据导入分析环境Rstudio中。原始数据以csv形式存储,我们将其导入Rstudio中,变为Data Frame格式,以便后续的分析查看详情
-
step4实验4 寻找最佳组合变量,利用draft数据预测因变量在上一步的实验中,我们将要完成对变量的选择。变量选择的目的是去除一些不必要的变量,将变量数量控制在一定范围内,从而方便分析。查看详情
在工业上,变量选择往往遵循以下思路:
1. 利用一些标准剔除部分变量,一般将变量数量控制在200个之内
2. 利用变量选择算法和模型,将变量数量控制在几十个范围之内
3. 去除不显著的变量
4. 去除在工业上不符合逻辑(符号和逻辑关系矛盾)的变量
在本项目中,我们尝试了上述的所有方法的组合,最后我们使用的是基于BIC的stepwise和 MCP。 -
step5实验5 利用draft、param和moit50数据预测因变量这一步,我们将利用Xd, XP, Xt预测Y,即Y= f(Xd, XP, Xt),其中Xd为draft数据,Xp为param数据,而Xt为生产过程的监控数据,即monit。这一步需要经过一系列的数据清洗,随后利用binning的方法处理数据,再进行建模、交叉验证、模型选择和预测。查看详情