在工业大数据应用场景下,基于CRISP-DM(Cross-Industry Standard Process for Data Mining,跨行业数据挖掘应用标准流程)方法论,阐述润滑管理领域中,工业大数据分析路径与实施步骤。
业务理解
工业数据分析中,最为重要且关键的一步是要将业务需求转化为可解且可达成的数据分析问题。这一步骤中经常会出现仅关注数据本身,不结合现实进行分析,导致分析结果和实际工况不匹配、无价值的情况。
数据理解
对数据的初步探索过程中,首先要理解数据和业务间的关联关系,包括需要哪些数据、这些数据是从哪里来的、是哪一类数据、怎么采集等。
再明确数据关联关系,如物联传感器采集的数据显示润滑油液中发生磨粒数据急剧增加,其隐藏信息为设备齿轮运行出现问题,导致剧烈磨损。润滑卫士一一对应数据和潜藏信息的联系特征,设立假设并进行实验验证。直至确定当前数据满足业务场景的需要。
数据准备
第三步,应对所需的数据进行加工与治理,包括原始数据抽取、多数据源融合、数据清洗与质量提升等。
模型建立
如果说在实施工业大数据项目前,是通过历史数据估算润滑场景价值点,来判断是否可以通过场景数据采集实现最终目的。那么,到了具体的应用落地实施阶段,则需要依赖现有的大量预处理数据,对业务场景的价值进行更具体的计算。
模型验证与评估
建立起合适的算法模型最终目的是为了解决业务实际问题。在此基础上,模型的验证尤为重要。模型的验证是对分析模型从数据和技术的角度进行充分检验评估,确认数据分析的结果或模型是否满足具体工业应用场景的使用需求。
模型部署
模型在运行过程中,还应持续修正、迭代和完善。另外,基于现有数据完成模型的上线后,还需进一步评估,进一步迭代模型,如此反复,不断优化模型,得到更可靠的分析结果。
工业大数据项目的实施与落地离不开方法指引,离不开场景选择、业务逻辑的深入理解,也离不开高质量的数据保障、大数据技术与业务流程的融合,更离不开算法模型的持续迭代和专业的战略合作伙伴与人才支撑。
麦可思致力于利用大数据、物联网、区块链等技术,构建工业B2B数字科技平台,为工业中小企业提供线上化集采、供应链数字科技服务以及工业园区数字化,助力工业产业集群的发展和企业数字化的转型升级。麦可思强大的智能供应链风控系统,打通了供应链端到端,完成从生产、加工、销售全流程的数据采集和监管,形成产业大数据进行智能风控决策,落地企业画像,助力企业增信。
业务理解
工业数据分析中,最为重要且关键的一步是要将业务需求转化为可解且可达成的数据分析问题。这一步骤中经常会出现仅关注数据本身,不结合现实进行分析,导致分析结果和实际工况不匹配、无价值的情况。
数据理解
对数据的初步探索过程中,首先要理解数据和业务间的关联关系,包括需要哪些数据、这些数据是从哪里来的、是哪一类数据、怎么采集等。
再明确数据关联关系,如物联传感器采集的数据显示润滑油液中发生磨粒数据急剧增加,其隐藏信息为设备齿轮运行出现问题,导致剧烈磨损。润滑卫士一一对应数据和潜藏信息的联系特征,设立假设并进行实验验证。直至确定当前数据满足业务场景的需要。
数据准备
第三步,应对所需的数据进行加工与治理,包括原始数据抽取、多数据源融合、数据清洗与质量提升等。
模型建立
如果说在实施工业大数据项目前,是通过历史数据估算润滑场景价值点,来判断是否可以通过场景数据采集实现最终目的。那么,到了具体的应用落地实施阶段,则需要依赖现有的大量预处理数据,对业务场景的价值进行更具体的计算。
模型验证与评估
建立起合适的算法模型最终目的是为了解决业务实际问题。在此基础上,模型的验证尤为重要。模型的验证是对分析模型从数据和技术的角度进行充分检验评估,确认数据分析的结果或模型是否满足具体工业应用场景的使用需求。
模型部署
模型在运行过程中,还应持续修正、迭代和完善。另外,基于现有数据完成模型的上线后,还需进一步评估,进一步迭代模型,如此反复,不断优化模型,得到更可靠的分析结果。
工业大数据项目的实施与落地离不开方法指引,离不开场景选择、业务逻辑的深入理解,也离不开高质量的数据保障、大数据技术与业务流程的融合,更离不开算法模型的持续迭代和专业的战略合作伙伴与人才支撑。
麦可思致力于利用大数据、物联网、区块链等技术,构建工业B2B数字科技平台,为工业中小企业提供线上化集采、供应链数字科技服务以及工业园区数字化,助力工业产业集群的发展和企业数字化的转型升级。麦可思强大的智能供应链风控系统,打通了供应链端到端,完成从生产、加工、销售全流程的数据采集和监管,形成产业大数据进行智能风控决策,落地企业画像,助力企业增信。