知网访问慢,谁的锅?与飞享NEM一起走进科学。
背
景
信
息
小编接到某财经大学信息中心老师反馈的一个疑难网络问题案件,该学校师生经常向图书馆投诉知网打开速度慢,图书馆又投诉到信息中心怀疑是网络问题,信息中心通过各种网络运维工具发现,网络层面并没有问题。那么,学生投诉的问题真实存在吗?如果问题存在,症结点在哪里?我们一起借助NEM智能运维机器人,走进科学。
探案第一回
学生投诉的问题真实存在吗?
现场部署
飞享根据问题初步分析,在学校图书馆重点区域部署了NEM智能运维机器人。同时在飞享杭州实验室也部署了相应的对比机器人,用来做数据对比分析。
本阶段探测目标锁定知网和万方数据:
数据展示
从 NEM 数据总览可以看出各个区域探针的各资源评分情况,校内知网访问性能不及格。
探案小结
综上数据可知学生投诉的问题确实存在,但校内知网访问性能不合格的原因是什么,还需做进一步排查分析。
探案第二回
探究问题的症结点在哪里?
观点
The viewpoin ▷▷▷
1
问题是否只是某一个机器人的个例?
A:从探测任务详细执行记录可以看出,图书馆内 3 个机器人得分都比较低,问题并不是某一个机器人的个例。
观点
The viewpoin ▷▷▷
2
问题是否与访问主域名网络出口运营商有关?
A:由 NEM 路由追踪我们可以看到机器人的网络出口运营商,并非同一个运营商但出现了同样的问题,初步判断与运营商出口无关。
观点
The viewpoin ▷▷▷
3
问题是否与时间有关?
A:从性能得分趋势图可以看出,问题出现具有时间规律,每天 8:00-23:00 性能较差,其他时间段性能得分很好,问题出现的时间段正好是用网高峰期。
通过NEM探测录屏、首屏时间等信息确认知网访问速度慢的问题确实存在,但要彻底揭开谜团,还需找出问题的根源所在。
接下来飞享将通过NEM元素瀑布图、DNS解析、路由追踪等功能协助进行全方位排查,探究根本原因。
通过联盟数据对比其它高校访问知网用户体验情况,核实知网问题是否为区域普遍性问题,解开问题的症结所在。
-是什么原因导致知网得分较低?-
•
NEM元素瀑布图全方位排查
•
通过NEM元素瀑布图功能分析出,问题出现时是子域名 login.cnki.net 下的top.js 或者子域名 t.cnki.net 下的 collect_nzkpt.js 加载失败,导致首屏时间长引起用户体验分数不及格。
高峰期元素加载失败截图
同一个机器人非高峰期元素加载成功截图
云机器人高峰期元素加载成功截图
►
元素加载失败原因分析
元素加载失败大多与加载的路径有关,下面重点对比分析问题子域名下的元素加载路径。
由分析可以看到三台探针访问主域名是从非电信出口,访问两个问题子域名却是走的电信出口,而且路径经过了香港。
探案小结
通过元素瀑布图发现有2个文件高峰时获取不到,查路由得到初步结论:问题域名走的电信出口,高峰时段路径通过了香港节点,海外出口高峰期紧张导致延迟引起的资源加载缓慢或失败。
-揭秘症结所在-
•
NEM高校联盟数据对比分析
•
根据分析到的初步结论,飞享通过NEM联盟发现其他知网体验比较好的高校,login.cnki.net 和t.cnki.net两个域名解析到了教育网IP,并且路径不走香港,于是建议学校调整DNS,使login.cnki.net和t.cnki.net解析到教育网IP。调整完以后知网体验得到了大幅提升,高峰期体验依旧稳定,问题迎刃而解。
调整前,联通IP 调整后,教育网IP
这期任务圆满结束,更多案例
敬请期待~
欢迎扫码关注
一起排查网络问题