独家采访:关于8月9日安省Rogers线路大面积断网事件
2019年8月9日周五晚,安省发生了一次重大的网络事故,所有依靠Rogers Cable 提供上网服务的客户包括所有第三方网络公司及部分Rogers自身客户上网服务全部中断达5-6小时,少部分客户直到8月10日仍然未恢复,我们就此采访了加拿大最大的华人网络公司CIK 的CEO Jordan先生。
Jordan:这次断网故障,受影响的主要是使用Rogers Cable 线路的客户。包括Rogers自己的客户,第三方网络供应商,以及CIK一半以上的Cable用户。而使用我们的FTTB,Bell,以及其他Cable的用户并未受到影响。
大概在8月9日下午18:40左右,我们网管中心监测到与Rogers连接的所有光纤流量消失,同时 所有呼叫中心技术支持队列急剧增加,我们便马上启动应急方案:网络工程部开始检查内部所有设备,同时通知所有呼叫中心录音通知客户故障,并更新社交媒体发布故障消息。
18:50左右判断问题不在我们内部,跟踪到Rogers网内各节点。
18:50 开始与Rogers支持中心联系,同时联系Rogers经理,直到19:50左右接通Rogers支持电话,马上被告知所有TPIA公司网络全部中断,恢复时间未知。
在晚上21:20之前网络有几次短暂恢复,又中断.
21:20恢复后一直22:40,然后再次中断至23:00.
23:00完全恢复。极少部分客户需要重启Cable modem 或路由器后正常工作。
我们网管中心也提供了当晚的网络状态图。
对于这次事故的造成原因,我们被告知是由于Rogers的CMTS和BGP设备故障造成的,我们仍然在寻求Rogers解决方案以避免再发生类似的问题。
记者:我有一个疑问,为什么ROGERS网络故障会影响CIK 的网络服务呢?
Jordan: 这个问题问的很好,相信也是很多客户的疑问。我们的高速上网客户接入部分有3种。1. 我们自己建设的纯光纤到楼(FTTB)网络,此次事故未受影响 2. 租用Bell 的FTTN& DSL 线路,也未受影响,3. 租用Rogers Cable线路,这次全部中断将近4个小时。我们是在2010年与Rogers达成租用协议的,当时也是一大新闻,是从2000年来第三家与Rogers对接的公司。我们租用Rogers的最后入户CABLE线路以及CMTS/DHCP服务器,Rogers负责最后入户的线路安装维护以及将CIK客户的网络数据单独分开,转发给我们的网络接口。这次出问题的地方就是负责客户数据转发的BGP路由器以及其每个节点的CMTS系统,导致所有数据未能转发给我们以及其它所有租用Rogers线路的公司。
记者:为什么在故障期间及过后,客户拨打CIK服务电话会打不进来?
Jordan: 在这次大面积网络中断期间,我们大概有几万客户受影响,而我们服务热线的最大同时接通电话数是根据高峰期间最大话务量设计的,在这种大面积故障时,导致我们服务热线被打满,对此造成的不便我们非常抱歉,在事故发生的第一时间,我们公司所有员工就紧急动员用各种方式通知我们的客户。
记者:这次事故后,你们如何防止类似事故再次发生?
Jordan: 老实的说我们没办法防止,因为事故不是由于我们自身网络故障造成的。其实这次同样的事故已经发生了2 次了,我们都在第一时间报告了Rogers,并要求Rogers迅速维护。 同样,我们租用Bell线路也完全取决与Bell的 网络维护。我们能做到的就是避免我们自己网络出问题,还有一旦出现问题,马上判读问题所在,并且报告线路所属方。
此外就是继续大力发展我们自己的光纤到楼到户网络,目前我们FTTB在多伦多,蒙特利尔和温哥华大概有3万公寓多户,还在迅速增加。这个应该是唯一办法吧。