生产企业大数据平台建设项目建议书v2.docx
- 文档编号:26355466
- 上传时间:2023-06-18
- 格式:DOCX
- 页数:12
- 大小:497.33KB
生产企业大数据平台建设项目建议书v2.docx
《生产企业大数据平台建设项目建议书v2.docx》由会员分享,可在线阅读,更多相关《生产企业大数据平台建设项目建议书v2.docx(12页珍藏版)》请在冰豆网上搜索。
生产企业大数据平台建设项目建议书v2
生产企业大数据平台建设项目建议书v2
大数据平台建设项目建议书
第一章、项目背景
企业对信息化工作历来较为重视,也是省内较早开始实施信息化的大型企业。
目前已经建成财务系统、生产调度系统、农务系统、供应链系统等:
调度系统,2015年公司共投资了175万元,按集团分步建设、逐步投入的规划,完成了系统基本硬件与亚控平台软件的结合,构建了一个以明阳糖厂生产调度指挥中心为核心,生产信息能够上至集团,下至车间的生产调度网络系统。
农务系统,2005年开始实施,经过多次升级,现涵盖了计划、报蔗、派车、质检、过磅、结算、短信管理、移动应用等一系列模块,覆盖公司4家直属糖厂和大桥制糖公司,实现了农务统一的信息化管理。
供应链系统,利用用友NC供应链系统,以公司存货管理为核心的采、供、销、存供应链管理平台,实现物资、仓储、供应、销售、物流一体化业务协同处理平台,建立了公司对各直属厂工作的监督平台,总部可以实时对下属各公司的工作进行监督,实时对各公司的具体业务执行情况进行查看,及时的对下属公司进行指导和监督。
尽管在两化融合及企业信息化方面已取得了相当的成效,但在实际应用过程中仍然存在一些较为显著的问题。
(一)总部与下属糖厂未实现完全的集约管理
a)企业在原先六家糖厂的基础上,又收购了三博公司五家糖厂。
三博五厂由上海迁回南宁,在宜州设立管理下属五厂的二级管理总部。
b)从系统部署上分析,企业总部与原先六厂为一套架构,而三博总部与下属五厂为一套架构,各自独立,暂未整合为一体。
c)为了保证各糖厂生产的稳定,企业总部与下属六厂之间仅在NC供应链、OA、财务、人力等系统方面实现了集约管理,农务管理系统、生产调度系统以及化验系统均由各厂自建,因此出现各厂建设系统的厂家不同,使用的系统版本不同等现象。
三博总部与下属五厂的关系亦如此。
(二)总部及各厂之间的数据共享有限
浅入深的方式划分为几个阶段:
(一)对总部及下属六厂各系统的数据进行整合、共享及分析,以企业六厂为基础,搭建大数据平台框架,在不对基础系统进行迁移整合的前提下,对数据进行整合并建立数据之间的关系。
并制定一定的数据采集规则,获取三博五厂的数据。
(二)基于大数据平台全面的数据共享能力,强化数据的表达深度,能够对原有汇总的报表数据进行更细粒度的表达和展示;这里可能需要创建新的应用服务系统或者是扩充原有的服务系统来完成。
(三)完全整合三博所属五厂系统及数据,消除企业内部的数据孤岛。
(四)面向外部进行数据扩充,例如利用网络进行相关行业的数据抓取,并将数据整合到大数据平台,结合既有的内部数据建立运营决策系统。
第二章、建设内容与方案
基于对整合三博五厂系统及数据难度的考虑,本次项目以第一、第二阶段作为项目的主要内容。
3.1、建立大数据平台基础架构,整合现有生产及管理系统
由合作方负责建设大数据平台基础架构,整合现有的各个生产及管理系统,将各系统的生产及管理数据进行集中统一管理、分析,对大数据平台建设提供相应的支撑。
大数据平台的总体架构及模块部署情况如下:
3.1.1、总体架构
3.1.2、模块划分及部署
根据大数据平台建设的要求,大数据智能决策平台(大数据存储、计算及分析平台)主要由三大模块组成:
数据采集模块、存储计算模块及访问支撑模块。
Ø数据采集模块:
数据采集模块提供支持多数据源提取、多通道传输、多种方式聚合的数据采集工具及接口,包括flume代理集群日志采集、Chukwa实时数据采集、Python网络数据爬取、Sqoop关系数据库数据批量提取、HDFS文件上传下载FTP客户端及多通道数据源整合实时分布式消息系统Kafka。
Ø存储计算模块:
存储计算模块实现了海量数据存储、批处理计算、实时计算、机器学习、图计算、实时查询及集群运行监控等功能,包括YARN分布式资源管理系统、分布式文件系统HDFS、Spark/MR批处理、Spark实时计算、GraphX图计算、MLLib机器学习、Hbase实时查询、Hive等Sql计算引擎、MySql关系型数据库及Dr.Elephant等可视化集群监控工具。
Ø访问支撑模块:
访问支撑模块提供了上层软件易于使用和编程的大数据平台层接口及内存数据库,包括封装了SparkSql、Hive、Phoenix的sql查询接口,封装了MR、Spark开发函数库的API编程接口、工具及redis内存数据库。
系统部署:
基础Hadoop大数据平台服务器集群由一台主机(Master)、三台从机(Slaver152/153/154)、组成。
平台采用分布式集群方式工作,提供N+1冗余模式。
3.1.3、通过建设,提供存储及数据服务能力
1)存储能力:
初期建设完毕按照其物理硬件配置,平台实现如下存储能力指标:
Ø业务数据存储:
1TB业务数据
Ø实时数据存储:
8GB
Ø实时数据查询:
2秒
Ø业务数据查询:
10秒
Ø存储动态扩容能力:
根据后期系统以及数据迁移的需要平台具备动态扩容能力,在先期物理设备所提供的容量不能满足业务发展需要的请下进行动态扩容。
2)业务数据支持:
根据企业既有业务系统以及对应的实际行业和运营特征,基于大数据平台被划分为三级数据存储,各级存储的建设目标描述如下:
A.一级存储:
平台的原始业务数据存储层,面向企业内部的原有各大业务系统,支持其将原有数据存储完全迁移到大数据平台,即提供数据融合能力外还把原有系统的基础存储支持作为平台基础能力;也支持通过文件或者消息方式将其部分的融合数据以非实时或准实时的周期上传到大数据平台,主要用于业务数据融合。
B.二级存储:
细化的融合层,主要面向现有业务之间的数据融合沟通,解决现有业务系统之间数据互通问题;同时在该层对于基础业务数据进行整合以及基础计算,产生新的业务数据并存储,为更高层级的业务运维提供大数据支撑。
本层数据是对基础数据的第一级融合计算,主要面向业务。
C.三级存储:
基于二级存储数据进行高层的决策分析计算,产生最终的运营支撑和决策分析结果数据,该层次计算过程中将应用各种统计、分析、学习算法;同时也给予业务访问特征,将二级存储的热点数据组织为热表进行存储,对外提供高速数据访问接口。
3.2、对目前生产及管理中涉及的数据进行采集并予以整合
3.2.1、内部数据整合
完善现有农务管理平台、NC供应链平台、生产调度平台、电子商务平台等与企业供产销业务流程相关的系统采集数据功能,统一集中管控的形式,将公司管理范围内的农户、车辆及地块信息、糖厂生产信息集中输入到公司总部平台中,完成集中化采集及管理。
1、优先针对农务系统以及生产系统进行数据整合共享,再次是NC系统;考虑整合的主要目标是可分析业务数据,图片图表等文件类型数据不考虑在大数据平台上存储;可以存储在其它位置仅在大数据平台上存储其位置信息;
2、在各分厂数据库服务器上部署数据采集代理,按照业务数据规则要求最高以准实时的要求同步数据到大数据平台;或者首先以生产报表为周期在同步报表数据的同时同步相关详细数据记录。
将以上各平台采集到的结构化及非结构化的数据以统一的数据规则进行处理,通过图形可视化的方式,对采集到的数据进行抽取、转换、加工、整合,最大程度的简化数据并采用过程流式的组织方式进行数据集成应用开发。
3.2.2、外部数据采集
利用爬虫技术,帮助企业把外部互联网的各类相关数据资源转变成企业的数据资产,并且与内部数据结合,结合的数据挖掘平台和文本处理技术,能够从海量的文本数据中智能地获取深度的价值信息,最终形成行业的发展趋势、竞争对手情报、竞品对比分析、以及各类数据提供服务,如财报数据、宏观经济数据、价格指数等。
3.3、利用采集的数据进行挖掘分析,输出有价值的成果
3.3.1、经营分析
主要分析价值链,包括种植、加工、销售三个阶段,依据企业价值链模型展开分析,如种植-加工生产(采购、生产、质量)-销售物流(仓库管理、销售管理),纵向分析各职能对主价值链的支撑与协同。
3.3.2、生产分析
利用大数据处理和分析方法,挖掘工艺参数(如处理甘蔗、初压汁、末压汁、打包蔗渣等流程)、优化协同时间(实际榨蔗时间、生产安全率、设备故障损失时间、部门/公司协作流程时间优化等)、成品糖(优级白砂糖、一级白砂糖、一级赤砂糖)产量之间的流程工艺优化、生产能耗分析(混合蔗渣、滤泥、废蜜、辅助材料、燃料及汽电消耗等)、产能分析(多维度分析,如糖产率),优化生产流程、降本增效、提高收益、实现利润最大化是生产主题的核心内容。
3.3.3、销售分析
分别从天气、气候、成熟过程、运输等对甘蔗成品的影响,以及成品糖的整个生产过程(如收割、榨汁等)分析,实现降本增效,确保甘蔗的高峰生长期间提升甘蔗的单位产量和品质,产糖率保持在稳定向上水平,保持稳定不变的甘蔗甜味比率。
3.3.4、行业分析
1、行业发展动态跟踪
2、行业发展分析
1)糖业发展景气指数:
宏观环境数据(GDP增长率、工业增加值、人均收入、人口信息、农业人口、糖业产值等)、市场数据(总体规模、市场份额、竞争信息等)、生产数据(甘蔗种植面积、产量、产糖量、劣质比例、销量、价格、设备运行数据等)、供应链数据(竞价信息、物资仓储信息、供应销售信息、物流信息等),建立算法模型,输出糖业发展景气指数,动态显示糖业目前发展情况。
2)糖业发展分析:
市场经济环境分析、竞争环境分析、糖业环境发展、企业内部发展分析等。
第三章、时间进度
1、建设期限如下:
(1)系统硬件需求建议及配备:
项目启动后30天内。
(2)2017年12月底完成股份大数据项目系统基础平台搭建。
(3)2018年6月底,完成内外部数据的采集及整合。
(4)2018年12月底,完成数据整合、决策分析模型、预测分析模型与算法。
(5)项目整体完工:
2019年6月底。
2、工作计划如下:
阶段
任务
计划时间
交付地点
需求调研
1.1
项目启动
2017/6至2017/7
广西区内指定地点
1.2
范围定义
广西区内指定地点
项目规划
2.1
制定项目计划及实施解决方案
2017/7至2017/8
广西区内指定地点
实施交付
3.1
系统基础平台搭建
2017/8至2017/12
广西区内指定地点
3.2
数据仓库
2018/1至2018/12
广西区内指定地点
3.3
主题分析
广西区内指定地点
3.4
数据测试
广西区内指定地点
3.5
应用测试
广西区内指定地点
3.6
数据修改以及应用调整
广西区内指定地点
3.7
将开发系统组件部署到生产系统
2019/1-2019/6
广西区内指定地点
3.8
项目培训
广西区内指定地点
3.9
系统上线
广西区内指定地点
4.1
系统优化、项目回顾及验收
广西区内指定地点
第四章、项目预算
本次项目投资预计280万元,其中项目软件投资建设费用约200万元,网络服务器等硬件投资约80万元。
第五章、企业效益及社会效益
项目实施后,实现对企业总部及下属11厂的系统数据实施整合,并进行集约化、系统化、精细化的分析,使管理层及业务管理部门通过统一平台实现对下属各厂生产情况的实时管控,以支撑更快、更准确做出相应的决策。
同时,通过对原始数据的采集、存储、分析、运算,为业务流程上“蔗农、蔗管员、砍运工人、压榨、生产、销售、决策层”各环节的角色提供精细化、实时化的分析、决策指导,为增加甘蔗产量、提高生产效率、深化运营决策提供信息化基础。
更进一步通过的实践,为广西甚至全国制糖业输出具有实际参考价值的行业大数据分析及决策成果,促进全国及广西制糖业的发展。
第六章、结论
1、大数据平台是国家和地方鼓励类项目,符合国家和地方两化融合相关政策
2、大数据平台的建设及技术的应用,将对传统的制糖产业产生深远的影响,促进传统产业更快的向智能化、精细化、高效化方向发展。
同时,作为一种重要的战略资产,大数据应用不仅有助于企业改进产品和服务、创新业务模式,还可以帮助政府部门敏锐地分析把握经济走向、进行科学决策,推动行业经济持续健康发展。
3、大数据平台的建设将推动企业内外部数据资源的整合、利用,并形成新的数据资源,作为推动企业进一步发展的新型动力。
4、建议项目尽快投资建设。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生产 企业 数据 平台 建设项目 建议书 v2