随着视频监控系统部署的规模越来越大、覆盖范围越来越广、战线距离越来越远,依靠传统的运行维护模式和技术人员个人的技术经验,对整个系统中成千上万的设备进行维护(尤其是摄像头),变得越来越力不从心,对数量众多的设备进行实现有效的、精准维修更是不可能。一个完整的监控系统不仅是前端摄像机单个方面的问题,他还包含全系统从前端摄像到后端服务及应用全路径上的摄像机、存储设施、交换机、路由设备、光端机、电源、光纤线路、服务器、控制器、显示器及UPS电源等众多的电子设备。面对这样一个超大规模的设备要素集群,要求运维责任主体提供各要素健康运行状态,为资产管理部门提供掌控维护保障的全透明管理,提升投资效率;为监控应用主体提供及时准确获取不间断有效数据,提升侦查办案效能;为系统维护主体提供及时感知系统各要素健康运行数据,实施故障精准调度、有效维护,降低运维成本、提升效益;为工程技术人员提供精准的故障定位,减少对经验的依赖和劳动强度,提升维护时效等已经成为行业的主要问题。
能对前端摄像头、服务器、应用服务等设备,按计划和任务进行全自动的健康状态及画面质量检测,给出软、硬件设备健康诊断报告。对于处于故障或亚健康状态的系统设备,按要素类别和告警的优先级进行分类组合建立告警机制,亚健康状态给出预先告警,故障直接给出运维调度指令。
利用物联技术对前端设备状态(包含存储设备、分析设备、诱导系统、摄像机、补光灯等)、供电故障、网络拥塞故障、光纤故障、设备故障的分类检查诊断、自动修复,实现供电、网络及设备软性故障自动修复等。
辅助监控系统完善自身管理功能,确保系统稳定运行、全时可用;完善自身考核功能,数据可核对、无抵赖;确保设备软性故障等自动修复,实现视频图像信息的全天候应用。
运维保障数据与监控数据传输建立分路分层级安全体系,实现视频图像与故障信息传输互不相干,快速修复,敏感故障信息不泄露。
设备健康运维保障系统分为数据前端、数据层和应用层组成
(1)数据前端。资产管理主要针对前端设备及各功能服务器进行信息录入、修改或删除,并实现各项资源描述的规范化、标准化,为设备查询、业务功能应用提供基础数据。包含范围:服务器、各类前端设备及动环监控相关设备等。
采用目录分布式对象管理技术,将各种资源对象(摄像机、工控机、LED屏、服务器等)都存储在数据库中,每个对象在全网中都有唯一的编号,实现对设备规范管理。
(2)数据层。故障信息和资产目录管理数据库汇总存储设备前端或诊断管理系统上传的故障信息,存储诊断信息及其预警处置信息、故障统计信息、在线率统计等数据内容,实现与运维综合管理应用平台、GIS、图像信息等系统的信息共享交换。
(3)应用层。主要实现维护单位绩效、在线率、离线率、故障率统计、异常故障分析提取、诊断分析、系统管理等功能。
设备健康运维保障系统分为市中心、区县分中心以及公安检查站、派出所二级数据分布和管理。故障信息和资产目录管理数据库设置在各市的运维存储子系统中。
(1)前端数据库:汇聚、存储本地路口前端系统的设备信息,上传资产目录信息,并根据实际网络状况,实时上传故障信息;
(2)区县(市)局分中心数据库:存储本辖区内设备健康运维保障系统录入的资产目录、故障信息及维护信息,汇总、存储、并上传至运维数据存储子系统。利用本辖区存储系统中的数据实现预警处置、故障信息分析、绩效分析、报表统计等功能;
(3)、区县(市)中心数据库:汇总读取各点位运维数据存储子系统中的资产目录、故障信息及维护信息,并对点位数据进行预警处置、故障信息分析、绩效分析、报表统计等处理。
(4)存储时限:故障信息和设备维护信息5年以上,故障图片信息保存半年以上。诊断预警处置、故障信息、绩效分析、报表统计结果等信息保存10年以上。
按照视频专网、互联网二张网络部署,在视频专网内建设对应的运维平台系统,在互联网使用监控设备健康运行保障平台系统,通过服务付费,最终实现“双网双平台”的整体建设架构。视频专网、互联网分别由单一平台进行资源汇聚和跨域上传;确保业务持续发展,避免出现多平台融合系统不稳定,责任不清晰的问题。
为了系统安全,双平台做好边界隔离,按照要求所有网络均不直接与互联网连接,通过边界设备接入,避免联通互联网。
运维具有设备与资源规模巨大、设备种类庞杂、参与维护的人员众多的特点,单纯依靠传统的人工作业方式来进行日常巡检和维护管理,将难以保证整个系统的高可用性,需要专业的、自动化的运维节点来支撑。
为实现设备健康运维保障系统及其基础支撑运行环境的可视、可控、可管理,提高摄像头的在线率,保证系统的可靠运行,迫切需要构建一个高效、可靠的运行维护系统。运行维护系统将以满足城市视频监控建成投产之后的日常运行维护实际管理需求为根本,以全面提高资源综合利用率为主要目标,实现对全网设备“全天候、全过程、全方位”的集中监控、集中展现、集中维护、集中考核统计,保证城市监控系统能够发挥最大效益。
监控设备健康状态运行保障系统是运维平台系统的核心联网平台,汇聚区/县的故障信息,维护信息等。故障信息和维护信息在云数据中心进行存储,同时向区/县/市局平台上传维护信息和故障信息,以及故障统计信息,设备维护信息在上级平台需要时调用。
设备状态资源包括市局直属的运行数据和区/县运行数据两部分内容,通过专网接入。前端系统产生的故障信息、维护信息和故障图片信息通过系统上传到市存储子系统进行存储。通过区/县边界接入安全平台实现互联网数据互通。
4、后端设备检测设计
主要实现对各类视频数据的采集与控制。提供相应的开放式数据集成配置接口管理功能,支持多维数据的动态规约,满足未来新增视频数据的动态扩展。与此同时,由于集中监测主机是所有视频数据管理的集中入口,实施时将部署在前端节点处,动态调配所需资源,避免形成性能瓶颈。
对摄像机设备出现的常见故障,对各图像采集设备的视频质量做综合的评估,系统具有视频丢失监测、视频遮挡、模糊监测、亮度异常监测、画面冻结监测功能。系统利用先进的图像处理技术,提取图像时空特征,并从人眼感知的角度来进行定性,实现视频故障/异常诊断、故障/异常严重性评判。
全面的数据采集和整理,是管理的基础。全面支持了网络设备、IP地址空间、业务支撑组件、数据流分析等监测:对于数据中心设备支持IBM、惠普、戴尔、华为、浪潮、联想、大华、海康、捷盛诺等几十家服务器厂商进行监测。
(3)网络状态监测
对接前端光端机(SNMP)、视频传输网络交换机(SNMP)。对于网络设备支持Cisco、3COM、华为、迈普、联想、天融信等几十家网络厂商和安全厂商设备进行监测。
(4)运维设备监测
对于运维节点的网络、光纤、供电监测及控制。对于运维设备(运维主机、传感器、智能机箱、智能锁)支持盾华、捷盛诺、坤科、海德等几十家自动运维厂商进行监测。
二、运维平台功能
1、资产配置数据库(CMDB)
资产配置库(CMDB)建立IT 基础架构的单一信息参照,为各项运维业务提供流程和数据支持。资产配置库遵循ITIL/ISO20000标准,采用面向对象的建模设计方法建构,维护每个配置项的详细数据、各配置项关联的维修记录在内的管理数据。
2、自动巡检
根据对各类资源的监测要求建立巡检计划,自动执行各类巡检任务,及时向值班人员报告巡检结果。通过集中监控系统,定期对前端设备(视频摄像头、卡口、传输设备)、内场设备(服务器、存储等)进行可用性和健康度检查,及时发现故障并快速定位故障设备,显著降低运维人员的工作量,提高管理效率。
3、规范工作
结合“平安城市”的业务特色,根据运维管理体系的设计,规划化日常值班与巡检管理、故障修复管理、资产与配置管理等运维标准化流程,实现日常运行维护工作的规范化、标准化,并沉淀运维知识与经验。
4、综合管理
为了不重复工作,将所有维护知识进行累计规范,实现IT维护知识沉淀管理、通过全文检索方便查询、统一门户的方式进行发布管理。
5、运行量化
基于运维平台基础数据进行统计分析,量化前端设备的在线率、量化运维人员的工作量、量化各类设备的综合可用率等,从宏观上综合分析所有监测对象的运维状况,为业务系统优化、运维规划提供依据,为领导层进行系统升级、改造、扩容提供更加有效的工具,为业主单位对承接单位或者维护团队的维修服务考核提供数据支撑。
理清资源台账是实施有效管理的前提和基础,资产配置管理模块实现对各类资源的有效管理。
资产配置管理模块实现对以下类资源的管理:
前端设备:摄像头、前端存储设备、补光灯、立杆、取电方式等;
传输设备:包括光端机、GPON/EPON、交换机等;
内场设备:包括网络、服务器、存储、视频应用与模块等;
虚拟资源:包括IP地址、文档资料等。
通过资产配置管理模块可以实现:最大限度地自动收集全网资源,协助用户理清资源台账,并提供自动化的技术功能,保证各类资源数据的准确性和完整性。
支持与监控工具等第三方数据源的关联规则的建立,形成关联展现;
提供性能监控、配置管理、资产管理导航自定义,可分别关联资源模型,方便运维人员快速搜索、查看配置项的信息;提供图形化的配置关系展现。
资源台账维护管理基于ITIL理念,以生命周期为核心,实现台账的资产维护管理:资产采购、资产到货登记、资产报废的整个过程。同时系统将资产的部署、监控、变更、维护纳入资产管理,自动将资产的信息(资产编号、软硬件基本信息)进行对应,建立电子档案,提供维护支持。
提供与GIS地图的对接设计,提供强大的管理界面,满足不同层次的管理需要,针对维护人员、监测人员、单位领导都有不同形式的、直观的视图展现。
根据图层选择展示那些资源类型,每种资源类型根据地图缩放级别显示内容不一样,通过级别定制来达到最好的展示效果;展现资源信息与地图关联,可以查看资源的周围地理信息,也可以通过地理位置查询资源; GIS地图在资源故障时通过闪烁或者水波纹来提醒用户设备故障;
告警资源在地图级别提高到地图第一级别,所有故障资源可以在全图时展示,同时可以通过地图缩放下钻到具体的故障位置;选择一个摄像头,可以查看摄像头实时影像。
运维平台行为审计的功能要求如下:提供的日志接口采集平台客户端用户操作日志,获取用户操作记录信息(包括:用户登录、操作对象0
全文检索为运维过程中产生的大量数据提供了集中的查询入口,包括了工单、知识库、配置项等重要数据。类搜索引擎的界面设计,跟传统搜索引擎完全一样的使用体验,不需要任何学习即可掌握。
统一访问门户为用户提供了各种小部件构成的集中管理界面。通过与其他子系统的集成,将监控、资产和管理流程等信息在门户中进行统一展示,使各项IT运维服务工作通过统一管理门户得到有序处理。门户整合了各子系统单点登陆、权限管理以及访问日志管理等功能。
用户与权限管理为整体平台及后续管理提供统一的帐户管理和授权管理等功能,应支持地域、权限、角色和组织的管理。
12.4统一报表管理
系统内置灵活易用的报表,如:核心网络畅通率、一类(二类)摄像头在线率、卡口设备可用率、各级联网平台的存活率、各类设备(如根据品牌、型号、地域进行分类)平均无故障时间、租用线路的阻断时间等。
1.实现监控、事件告警、资产配置、流程工单的统一通知;
2.支持通知策略,包括通知对象、通知方式、业务场景、通知内容等;
3.提供短信通知方式等。
10、运维平台主要功能
序号 |
功能模块 |
功能特征描述 |
1 |
首页概览 |
首页重点显示视频通道状况;通道在线率/实时监测故障推送。 |
2 |
自动修理 |
查看设备信息、实时状况、自动修理的状态。 |
3 |
资产管理 |
资源状态管理实现对摄像机、录像、卡口相机、存储设备、网络设备、智能设备、平台、硬件服务器等资源信息、状态采集信息的管理及可视化展现。 |
4 |
地图展现 |
配套电子地图系统进行定位实现精准运维,设备具体位置与整体部署位置,同时可以选择不同图层进行设备展现; |
5 |
设备控制 |
利用远程控制模块实现前端设备控制。 |
6 |
故障管理 |
现用户方对系统中已经登记的故障类型相关信息查询;查询已登记故障类型信息,包括故障类型、故障描述说明等,提供故障管理功能,包括故障信息修改、删除故障记录、故障预案。 |
7 |
报修管理 |
提供业务人员可以通过疑难点位的查询列表,查看重点设备相关的故障信息。 |
8 |
设备故障统计 |
按照组织结构筛选,选择时间范围及输入维修次数即可点击查询统计出该时间段内所选组织及其下级已有报修设备情况。 |
12 |
维修及时率统计 |
按照组织结构筛选,选择时间范围及天数即可点击查询可以统计出该时间段内;所选组织及其下级报修故障总数及处理情况。 |
13 |
摄像机实时在线统计 |
按区域统计其下级点位的在线情况,同时可按照组织结构筛选,统计其下级组织各点位在线情况。 |
14 |
摄像机历史在线统计 |
用于统计点位的在线率,此报表可以用于考核运营商或者维护单位,作为每月租赁费用或者维护费用结算的参考依据。 |
15 |
设备报警统计 |
对各个组织发生的报警按设备报警类型进行统计,可按照组织结构筛选,选择时间范围后,点击查询统计出该组织及其子组织各报警类型报警数。统计项:所属组织、视频故障报警数、服务器故障报警数、网络故障报警数。 |
17 |
绩效考核 |
故障设备情况、设备在线率、工单修复率智能统计,快速定制出各种多样化的报表状态图(饼状图、柱状图、Excel),使用户能够形象、直观、快速地了解每个维护厂商的维修效率。每天产生的数据报表都会自动保存,用户可以随时导出某天的维护报表,可清晰了解每个设备的位置、运行情况等运维考核有理有据,考核排名一目了然。 |
18 |
供电诊断 |
摄像机电源诊断、故障原因分为停电、跳闸等原因。 |
19 |
网络诊断 |
远程控制设备对前端的网络进行监测,网络出现故障时,远程控制设备自动发送信息到后台中心服务器,中心服务器经过诊断系统,分析其原因并进行报警。 |
20 |
视频诊断 |
对摄像机设备出现的常见故障,比如亮度异常、信号丢失、人为遮挡、失效监测等故障;以及跟视频监控相关的视频设备、网络设备运行状态监测,视频信号传输的链路可用性和质量监控。以视频监控点为单位,提供完整的智能故障分析功能,利于方便的进行整网运行的状态展示和查询,并为运维管理系统提供详尽的故障信息。 |
21 |
设备配置 |
提供用户进行智能设备、卡口设备、网络设备、IPSAN设备等管理。增删改查,增加填写的信息待补充,并支持批量导入,提供导入模板。支持多类设备管理(智能设备、存储设备、网络设备、服务器等),设备显示跟随左边的组织树变化。 |
22 |
维修单位配置 |
对维修单位进行信息录入、维护等管理,通过显示跟随左边的组织树变化进行单位查询设备情况。关于单位联系人,必须是拥有维修角色的设备健康运维保障系统中的用户,可以选择修改一个维修单位的描述信息。 |
23 |
用户配置 |
用户添加时,需要配置“用户名”、“密码”、“确认密码”、“联系电话”等信息;“联系电话”用户维护流程中方便沟通或短信报警;对添加的用户进行角色管理。 |
24 |
权限配置 |
管理用户、角色、组织机构,为用户添加角色和组织机构,为角色添加菜单权限,提供密码重置以及密码解锁功能。 |
25 |
组织配置 |
与上级平台对接后,每隔1小时同步平台中的组织结构,并提供组织的管理和查询。支持手动添加、查询、编辑和删除组织信息。 |
26 |
日志管理 |
对访问本系统的用户,进行访问日志及操作日志管理。 |
三、系统升级内容:
1、终端EBS移动视图自助服务
本系统设计目标是建设一套对互联网平台和专网平台互联互通系统,包含互联网云数据中心建设,监控设备健康状态诊断器、平台服务器运行、链路费用。实现监控设备健康状态诊断及故障信息推送。
实现:预知故障,即在故障发生之前发现故障;实时告知,即在第一时间将故障情况通知相关的管理人员;确实设备损坏,即在预定的时间内处理故障,若未及时处理将采取升级措施;以上问题简单来说,实现“第一时间发现问题”、 “第一时间通知相关人员”,“第一时间处理问题”。
服务支撑
1、维修单位配置:支持对维修单位信息、维修人员信息的录入、修改;支持对维修单位的绩效考核规则设定。
2、运维管理:支持故障进行下发派单功能;支持对已有派单进行信息跟踪,且可取消或重新派单;支持对过往的维修记录查询 。
3、统计分析:支持对视频设备的故障、自动修复的记录、维修单位的修复情况进行报表统计 。
4、移动自助EBS服务:支持维修人员登录查看用户信息;支持对已派发的派单进行查看,并可接单;支持到达现场后扫描确认到达;支持对维修结果提交到服务器;支持查看历史维修记录 。
服务软件模块、数字视频设备、监控摄像头和图像质量进行实时巡检诊断、自动智能修复系统、故障记录、告警、统计分析、故障旁路、设备和软件模块整合于一体的智能化运维管理系统。
1、系统组成
系统由云数据中心、分析主机、网管客户端、监控设备健康状态诊断器和移动终端等设备组成。监控设备健康运行状态保障管理系统;包含WEB服务、数据库服务、健康数据存储服务、报警转发服务、移动终端服务组成。
1.1自助服务
工单生成,系统支持手动和自动两类工单生成方式。填写工单时,各输入项优先提供选择项目,在选择项无法满足的情况下允许手动输入,手动输入后可以保存到选项列表;工单处理后,提交时,如:修复,未修复,未修复时,要给出未修复的原因;
对于视频前端故障,分别派给负责供电维修角色,光纤维修角色,设备维修角色,当工单都处理完后,系统自检视频前端是否已恢复,若恢复,则更新设备状态为正常;若视频前端还是故障,则触发新工单给管理员;EBS移动视图做人为判断,然后再重新派单;同时在以上环节中正在进行中,若系统检测到视频前端恢复,则自动结束所有工单;平台需提供故障确认功能,确认时需要输入维护人,工程商(维护单位)以及维护时间等信息,同时可以根据进度改变维护状态(已维护,维护中,等待维护,无需维护)分类进行查询;支持短信告警;
1.2故障管理:
故障采用派发维修任务机制,第一时间修复。运维平台发起维修机制指派维修单位进行修理。也可以通过设备健康运行状态保障管理平台进行托管。
终端EBS移动视图自助服务展示当前用户待处理、处理中、已完成、延期、超时这些类型的工单任务;告警记录、事件管理,可以查询设备告警的事件记录;值班言理,可实现电子化的排班管理功能;发布管理,支持公告发布管理功能,也可转为人工服务工作台处理。
1.3日志管理
系统提供日志查询与导出功能,日志记录关于软件操作的整个过程,包括操作人员的详细信息,重要信息可以进行打印备案。提供日志查询页面,方便用户查询历史信息,可以根据不同的条件查询来源,
1.4终端EBS移动视图
接收中心管理服务器发送的设备故障信息,以及分配給自己的维修工单。运维工程师到达现场后,与维修工单中故障设备标识与中心核对确认。同时,在终端设备上填写运维操作过程及维修结果信息,上传到中心管理服务器。
运維管理员根据管理服务器发送的维修工单,运维工程师可以打开故障报修功能,即可打开设备故障报修列表,信息包含了故障编号,报警时间、IP 地址、故障地点、告警等级、故障原因、维修单位、负责人。
具有GPS导航功能,指引运维工程师快速到达故障现场实施维护。设备具有采集设备唯一标识功能。通过手持设备GPS坐标定位功能,获得现场视频监控系统设备的物理坐标信息,便于后续运维的设备导航查找和定位。
四、主要设备技术参数指标
1、运维主机
配置WEB网页服务器:节点参数:存储容量≥250GSSD ,CPU: Intel Xeon处理器*1、内存:≥32GB; 2个千兆电口,
配置数据存储服务器:节点参数:存储容量≥8TB;CPU: Intel Xeon处理器*1、内存:≥32GB; 网络:2个千兆电口,
系统具备以下功能:(提供公安部检测报告参数证明,并加盖原厂公章)
★故障管理:支持故障报警功能;支持查询故障报警记录;支持根据故障配置报警等级;
★资产管理库:支持运维节点控制单元、网络设备、服务器、其他设备的信息录入、修改,及一键导入、导出
★综合诊断:支持查看视频设备的实时状态;支持查看网络设备的实时网络状态;支持运维服务器状态巡检功能
★远程维护:支持远程对智能机箱的开关控制;支持对智能机箱的控制参数设置 ;支持对智能机箱的报警参数设置
★维修单位配置:支持对维修单位信息、维修人员信息的录入、修改。
★运维管理:支持故障进行下发派单功能;支持对已有派单进行信息跟踪。
★统计分析:支持对视具有对视频设备的故障、自动修复的记录报表统计。
系统配置:具有对组织机构、用户信息、平台角色的增加、修改,及权限的配置。
★可对接第三方平台GBT28181:支持向GBT28181平台上报心跳消息。
★支持手机APP登录:支持维修人员登录查看用户信息;支持对已派发的派单进行查看
所投产品符合《GB 16796-2009安全防范报警设备安全要求和试验防范》提供具有有效期内的公安部权威机构的检测报告复印件加盖生产商公章。
2、分诊控制单元
主控制器 CPU: Intel Xeon 处理器*1,内存:≥32GB;硬盘2T企业盘, 网络:2个千兆电口(1)支持最大1000路视频巡检;(2)支持最大500台SNMP交换机检测及200台服务器检测;
(1)视频诊断;视频丢失检测、画面遮挡检测、轮巡诊断等功能
(2)网络诊断:支持虚拟节点、正常节点的网络设备进行巡检;
(3)服务器诊断:支持对服务器内存、容量状态进行检测
3、控制主机
主控制器 CPU: Intel Xeon 处理器*1,内存≥16GB;存储2T, 网络:2个千兆电口;与中心服务器实时数据同步;(1)前端设备修理:主要针对设备(摄像机等)由于网络死机不工作进行远程重启;(2)前端网络修理;主要用于前端网络设备死机引起的前端设备不工作进行远程重启。(3)前端供电修理:主要用于前端供电因雷击跳闸、线路老化雨天跳闸;进行上闸。(4)故障推送:主要用于分析各类故障的推送及分发。