
监控
一天平常无奇,集团管理区的一台汇聚交换机业务板卡发生故障。这种问题处理起来不算复杂,我便安排当天的驻场工程师晚上过去更换。然而,事情的发展却出乎意料……那位工程师换了板卡后开始接线,不知为何竟将设备接成了自环。由于数据中心骨干核心与那台汇聚交换机运行的是OSPF协议,整个网络瞬间陷入路由故障。更离谱的是,门禁系统部署在管理区内,而这次故障导致门禁系统也无法使用,这位工程师居然把自己锁在了机房里……大约五分钟后,
监控台值班人员打来电话,说系统出现大量告警。我立刻联系正在操作的工程师,要求他迅速回退操作,如果不行就直接断掉那台设备的电源。五分钟后,故障终于恢复。不久,集团地产
公司IT负责人来电,询问为什么刚才某楼盘在线抢房功能无法正常使用。我只能敷衍称可能是运营商网络波动造成的。从那以后,我就再也没见过那位驻场工程师……