北京市轨道交通大数据中心系统于2014年正式上线运行,依托北京市轨道交通指挥中心ACC、TCC、AFC监视中心、地铁能耗、交通委等平台系统,结合运营管理和决策分析需要,建立面向多用户的信息集中共享、资源高效利用、运行安全可靠的数据服务平台和综合信息数据仓库平台。通过对所对接系统数据的采集,并通过ETL加工过程完成数据加工,最终为上层应用提供数据支撑,实现跨业务的数据整合共享,提供灵活的数据查询功能、强大的数据分析和挖掘功能以及可定制的报表报告功能,以支持政府主管部门科学决策线网规划、运营管理、票制票价、财政补贴等工作,满足开展各项业务的数据需要,提高网络化运营管理水平。
2019年开始建设大数据平台,并于2021年正式投入生产。采用基于Hadoop技术搭建的开放式大数据平台,具备后期根据存储需要进行灵活和自主扩充节点的能力,当前大数据平台共有55台生产节点,10台测试节点,可使用空间达到1.1PB,已将MPP数据仓库系统的数据全部迁移至Hadoop平台,同时扩充了新业务,主要包括数据融合分析系统、乘客画像、运营日、全生命周期管理等业务。
公司负责北京市全路网33条线路、402座车站的相关数据的维护,通过数据分析可以挖掘乘客出行特征、乘客画像、职住特性,并通过断面满载率、单车满载率、进出站量等因素为线路车站提供是否限流、是否加车的决策支撑,同时接入了城市交通类数据(公交类、铁路类、航空类等数据)为分析通勤乘客、旅行乘客、出差乘客提供数据支持;接入中国城市轨道交通年鉴数据,支持分析各主要城市的轨道交通数据。实现对ACC、TCC系统分专业数据资源的一体化整合,满足不同系统间信息资源共享,信息交互分析的需求。