中联重科的工业大数据应用技术方案
为进一步提升设备的智能化水平,丰富设备数据采集维度,提升设备数据采集和预处理能力,中联重科研发了新一代 4.0 产品和智能网关。
中联重科产品 4.0是以“模块化平台+智能化产品” 为核心,深度融合传感、互联等现代技术,研发性能卓越、作业可靠、使用环保、管控高效的智能化产品。通过在设备上加装大量的高精度传感器,实时采集设备的运动特征、健康指标、环境特征等相关数据,结合智能网关的本地分析功能,真正实现设备的“自诊断、自适应、自调整”。相关数据通过多种传输渠道(移动网络、WiFi、蓝牙等)回传至中联重科大数据平台,通过相关建模分析为客户提供包括设备实时定位、工况监控、油耗分析、设备异常分析、故障预警、工作运营统计在内的高附加值信息服务。
打通多方数据,形成统一的工业大数据分析平台,对内辅助科学决策,对外提供智能化服务。平台融合了物联网平台、业务系统、应用系统及第三方数据,分析角度涉及产品、经营、客户、宏观行业等方面,服务涵盖轻量级应用(中联e 管家、服务e通等)和重量级专业领域应用(智慧商砼、建筑起重机全生命周期管理平台),并通过移动端APP、PC 端、大屏幕等多种方式提供高效增值服务。

中联重科工业大数据平台架构图
工业大数据平台整体采用成熟的Hadoop 分布式架构进行搭建。基于Cloudera CDH的发行版,中联重科从2015年底开始部署,同时进行相应的大数据开发工作。首先建立如客户类、设备、交易、信用等主题。然后把物联网平台、企业内部ERP、CRM等核心平台都在Cloudera大数据平台上贯通,并且通过相应的组件把数据采集到平台。
平台通过流式处理架构,满足高时效性的数据分析需求; 通过分布式运算架构,满足对海量数据的离线深度挖掘。前端通过统一接口层以多种通用格式对外提供数据分析服务。
考虑到大数据平台汇集了企业内外部多方敏感数据,为保证数据安全,平台引入了企业级数据治理组件,实现统一的元数据管理、数据质量控制、数据溯源、数据操作权限管控、数据脱敏及数据使用审计功能,并贯穿数据存储和应用的全过程。
拥抱开源 分析大数据技术未来的挑战
当问及为什么会选择Hadoop,周志忠博士表示:开源的生态环境中有大量人才提供贡献,我们认为比单一企业开发的环境更有生命力、更强壮。
第一:采用开源技术对团队的技术能力要求稍高。
第二:运营过程中的技术难点稍多一些。因此,我们选择开源的同时也采购了Cloudera的企业级服务,作为我们整个平台运营的保障。
第三:开源有很多问题,如很多组件之间的适配是不是最优、及参数涉及到一些复杂的问题。
所以采用发行版、企业服务的支持,就不需要把重心放在运维平台、系统的层面,而是更多的聚焦在业务分析、获得业务扩展等可创造数据价值的层面。
当谈及对大数据技术行业未来的期许,周志忠博士说:“目前从支撑应用的角度,大数据技术已足够。最主要的难点在于业务应用场景与现有技术、算法如何最佳地匹配。中联重科也在尝试机器学习方面的一些应用,如设备的健康指数评估,怎样通过不同维度、不同传感数据及公司内部的数据,建立模型。从模型角度,相应算法也能够支撑,但关键问题在于,数据是不是全备且准确,数据响应是不是及时等”。