Document Name EPKS系统通用备份维护手册
Version 01
Date November 9, 2021
Reference System Backup
1. 介绍
本文档以EPKS R511为基础,根据Honeywell标准手册的内容进行整理、精简,旨在为Honeywell GES China Junior工程师内部学习使用,在实际操作过程中应以Honeywell User Assistance 或Pdf Collection为直接依据,并根据现场情况酌情使用本文档的全部或部分内容。
本文档介绍了EPKS系统组态、FAT以及现场服务过程中对系统进行备份及维护的基本步骤和方法,对于系统装机和LSS升级项目的备份不在本文档范围内,请参考其它相关的手册。
2. 系统备份
在系统组态、FAT及现场服务中定期对系统进行备份是必不可少的。系统备份最有效的方式是进行服务器C盘的全盘备份,全盘备份的详细方法参考LSS Team系统备份与还原文档。如果系统组态变化不大也可以采用下面描述的文件备份。
2.1 备份路径
根据实际情况,自定义备份路径,基本要求是备份路径所在位置有足够存储空间且不影响系统在线数据存储。
例如:在服务器 B 的 D 盘建立名为 Backup 的文件夹,其中再建立以日期命名的文件夹,下一级分别按备份内容建立相应的文件夹。如下图所示:
2.2 系统常规备份内容
-
- EMDB
- ERDB
- Control Builder 静态程序
- QDB
- 流程图
- 趋势组
- 自定义数据格式
- Checkpoint
- 其它系统文件
2.3 EMDB备份
在Server B上打开 Configuration Studio,连接 System,右侧System Tasks中点击 Administer the system database。
依次选择 EMDB Admin Tasks àBackup Database。将文件命名为 EMDB_20190727,保存在上面指定目录下。如下图所示:
2.4 ERDB备份
在Configuration Studio中,选中 Server,左侧列表中选择Control Strategy,右侧任务列表中点击 Administer the control strategy database;另外一种方法是左侧选择Control Strategy,右侧任务列选择Administer the control strategy database,可以打开同样的ERDB管理界面。
依次选择 ERDB Admin Tasks àBackup Database。将文件命名为ERDB_20190727,保存在上面指定目录下。如下图所示:
2.5 Control Builder组态备份
打开 Control Builder,选择 File, Export,在弹出窗口中先点击 Browse,选择上面指定目录。点击 Select All,再点击 Export 按钮。如下图所示:
2.6 Quick Builder程序备份
打开 Quick Builder,选择 Export,在弹出窗口中选择 All items relevant to file type, 定义文件路径为上面指定目录,文件名为 QBDB_20190727,点击 OK。
2.7 流程图备份
将主服务器下的 abstract 文件夹复制到上面指定目录中。详细路径如下图。
2.8 趋势组备份
打开命令提示符,输入命令行:
Databld –export –def Trends –out TrendBackup_20190727.xml,
操作完成后,打开 C:\Users\experionadmin,找到名为 TrendBackup_20170727.xml
的文件,复制到上面指定文件夹中。如下图所示:
2.9 Checkpoint备份
打开Control Builder,右键点击控制器,依次选择 Checkpoint, Save Checkpoint Manually。弹出窗口后,可把所有控制器全部选择后,点击 Save按钮。然后打开 Station,在控制器的 Detail 画面中,看到 Checkpoint 进度 100%,并且状态为 Completed 即可。
2.10 自定义数据类型备份
打开Station,依次选择 Configure à Application Development à User-Defined Data Formats。 将所有定义的数据格式截屏。如下图所示:
2.11 自定义Acronyms备份
在Station中依次选择 Configure à Application Development à Acronyms à User。将所有自定义的缩略词进行截屏保存。
2.12 OPCI配置备份
在Station中依次选择Configure à System Hardware à OPC Integrator。将所有OPCI配置截屏保存。
2.13 系统其它文件备份
C:\Program Data\ Honeywell\ Experion PKS
- \Server\ Data\ *
- \Server\ User\ *
- \Client\ Station \xxx.stn
- \Client\ MenusAndToolbars\ xxx.stb
C:\Program Files (x86)\ Honeywell \Experion PKS
- \Client \System \R5xx \yyy.stb
- \Client \System \R5xx \sysnnn.dsp and htm*
C:\Windows\System32\drivers\ etc\hosts
C:\Windows\System32\Repl\Import\Scripts
如果使用Safe View,它的配置文件 zzz.wdl
3. 系统状态检查
3.1 FTE状态检查
FTE 连接状态需要现场工程师进一步检查各个 FTE 节点的接线是否正确,重点是下方截屏中 FTE 端口显示为 “SILENT” 的节点。特别是控制器相关的故障要及时检查排除。
3.2 交换机状态检查
检查交换机日志及端口状态,如果存在大量错误包或端口时断时续等情况应及时处理。
具体参考TAC Experion Audit Network文档
对于Cisco交换机推荐使用Cisco Network Assistant软件。
软件打开后即可对网络中的每台交换机装置进行检查,建议定期检查所有交换机如下图列出端口的连接状态:
软件功能详细介绍请查看 CNA 安装后自带的说明手册。
3.3 服务器及操作站硬件性能检查
在机器中打开 resource monitor 检查 CPU、内存、硬盘运行是否正常。建议工程师站的各种应用程序在使用后及时关闭,尤其是 FDM 客户端软件长期开启后占用服务器资源非常多。
对于磁盘的剩余空间,Microsoft推荐的典型值为磁盘容量的20%。尤其对于服务器更需定期检查。
3.4 系统冗余检查
- 冗余服务器RTDB同步检查
通过菜单View àSystem Status à Server Redundancy查看服务器状态。
特别需要注意System Repository的3个状态指示都应该是绿色的正常工作状态。
- 冗余服务器EMDB同步检查
在Configuration Studio中打开Asset组态工具Enterprise Model Builder检查EMDB同步。
- 冗余服务器ERDB同步检查
打开Control Builder检查ERDB同步状态。
- FILE REPLICATION 文件同步状态检查
检查各文件同步是否处于正常状态,如果出现部分状态为 Fail 的情况,选择进入状态异常的同步选项进行查询。通常故障可能是由于某些 console station 在网络节点中离线造成的,可在 console station 恢复后检查一下。
3.5 SYSTEM ALARM 系统报警状态检查
打开 station 软件,点击首页下方的 system,进入 station alarm 界面。
系统报警中常见问题及建议:
- OP 开路报警,建议检查接线;
- HART MODEM 报警,建议及时找适当机会对卡件进行重启并检查确认 HART 通道组态的正确性;
- 个别卡件没有响应,建议及时检查,如有问题及时更换备件;
- 报警中存在一些失效报警,需要及时通过”ALMINT -FORCE”清理。
- IOLINK 报警需要排查解决。
- Server Event Replication Failed 报警需要通过初始化事件数据库(Hisint -event)解决。
- “Device PV Range Mismatch” 和“Device ID Mismatch”报警需要处理。
- AI 卡件报警“Zero reference voltage out of range”、“Module Not Calibrate”如无法校准消除报警,建议更换。
3.6 事件查询及事件归档检查
在Station打开View àEvent àEvent Summary进入日志总貌。
Event summary 是查询当前事件选项,可按照时间、位号、报警级别等对事件进行筛选查询。
Event Archiving 是事件归档选项,需要注意 Emsevents.mdf 文件大小,过大容易造成服务器性能下降、归档失败等情况的发生。
- 在开车前等现场条件稳定后,尽早执行 EVENT 数据库初始化操作。
- 注意及时检查,取消无用的报警,或者设置更合理的报警值,建议控制在 200 条以内。
- 将暂时用不到的通讯通道 Inactive,等调试用到的时候再重新激活。
- 建议定期检查 Emsevents.mdf 文件大小,控制在 2Gb 以内。
- 建议各个装置统一事件归档路径。
HISTORY ARCHIVING 历史归档检查
建议全厂各个装置统一历史归档路径,并对归档文件夹做同步。下图为参考 History Archiving 设置情况:
3.7 时钟源同步检查
服务器 A 指向 GPS 作为唯一的时钟源, B 服务器时钟源指向 A 服务器。其他操作站指向 A/B 服务器为时钟源。
3.8 控制器及 CEE 状态检查
逐个控制器检查 C300 的 Minimum CPU Free 、CPU Overrun、Peer Communication 是否正常,若出现异常先截屏记录,再复位后应注意观察,特别是在所有程序全部激活运行(尤其是SCM)时此参数的变化。鉴于此建议将 Minimum CPU Free 参数加入历史趋势做观察分析。
3.9 MDBUS通讯
Modbus 通讯故障,建议现及时排查通讯故障的原因并处理,如果条件不具备,建议先 DISABLE 相应的通道或控制器。
3.10 DIAGNOSTIC CAPTURE TOOL诊断工具
若服务器出现异常后,在系统报警和事件中查询不到相应问题时,可在主服务器上打开 DCT 软件收集服务器中的 SQL 事件,供 TAC 进行事件分析。下图为 DCT 路径。
打开 DCT 后的界面如下,选择 save diagnostic package 即可生成记录文件。
Displays the most recent log messages 内为当前服务中的 log 事件。