数据中心网络常见通讯故障分析与处理

发布时间:2020-04-02 19:58:48   来源:文档文库   
字号:
2019年1月数据中心网络常见通讯故障分析与处理颜仕礼(丽江民族中等专业学校,674199)【摘要】数据中心一般通过一整套复杂设备,以网络为基础进行联结。其能否正常发挥通讯作用,能否有效、高速的工作,对于所在区域的各项工作,群众的基本生活来说,都具有着重要的作用。一旦出现了通讯故障,对于生产、生活都会产生影响,需要技术人员早发现、早处理,以最快速度恢复网络通讯。因此,笔者以数据中心网络为研究对象,通过对于其常见的通讯故障进行分析,总结出故障处理的方案,希望本研究可以为数据中心网络常见通讯故障分析与处理工作提供借鉴与参考。【关键词】数据中心网络;常见通讯故障;分析;处理【中图分类号】TP393.06【文献标识码】A【文章编号】1006-4222(2019)01-0141-011引言数据中心构建的目的是:收集、处理社会生活、各项事业发展,所涉及到的相关组织的各类数据。数据中心一般由计算机系统、相关配套设备、基础网络等构成,因此,数据中心实际上多个单一的数据库、文件服务器、应用服务器等的复杂集合,网络构成也十分复杂繁冗。从这个角度上来说,数据中心网络通讯发生故障是在所难免的,但是由于数据中心并不是独立的个体,其外部连接着数以万计的设备,数据中心的正常运行是诸多设备能否正常、有效工作的基本保障。因此,相关技术人员要不断的根据数据中心网络常见通讯故障进行分析,汇总故障方式及处理方法,进而在故障产生以后以最快速、最高效的方式进行处理,恢复数据中心的网络通讯。2数据中心网络常见通讯故障分析数据中心网络常见的通讯故障主要集中在:硬件故障、系统故障两个类别,笔者将分类论述:(1)硬件故障,数据中心是通过无数计算机硬件组成的,硬件出现问题,就会导致部分功能无法正常发挥或运作。无论是设备、线路、端口,哪一点出现故障,都会导致网络通讯故障的出现。硬件方面的故障相对比较容易查找,例如线路故障,一般的成因就是线路明显的老化或者破损,而影响到了整体网络的运营;再比如,端口故障,计算机端口作为数据中心网络的重要环节,若出现接触不良、损坏等传输问题,就会影响到整体网络的运行。硬件故障只要进行逐一排查,就可以及时进行更换处理,相对比较好解决。(2)系统故障,数据中心是计算机领域比较热门的研究之一,因此研究技术十分成熟。目前计算机网络构成主要包括TREE、FAT-TREE、BCUBE、FICONN等,主要采用模块化、层次化、扁平化的设计思路与虚拟化的分割管理技术,将成千上万台设备,以单元为单位进行划分,逐一进行管理。通过分层、递归的结构进行联结,尽可能的避免了所谓“关键节点”的存在。这样组合也形成了良好的冗余与容错性,如果其中出现故障的某一个或某几个单元,没有被检测出来,也不至于影响数据中心的整体运行。但是如果超出一定比例,就会在影响数据中心网络的高速运行,拉慢网络通讯的速度,所以仍旧需要针对性的查找故障进行处理。3数据中心网络常见通讯故障处理笔者将从故障处理的主要流程为切入点,对数据中心网络常见通讯故障处理的方式方法进行阐述:(1)分析故障现象,一般来说由于构成组件比较复杂,故障也呈现出不同的表现方式。因此想要对于故障进行分析,就要先了解故障的现象。例如,应用方面出现了支付系统支付不了,网页难以打开等问题,那么就要逐一检查相关的故障点,有哪几个故障是上述表现,如,线路故障,端口故障等,就要更换线路、端口等设备。因此,需要针对数据中心网络的几种常见的故障进行收集与整理,根据现象,进行检索、查找。(2)测试并确认故障范围,进行故障点定位。所有的应用业务是在这些物理硬件正常运行的基础上开展的,其中某些硬件出现问题就会导致故障。根据故障的表现,需要针对各个部分进行筛选检查,例如,对于服务器进行测试,检查网络设备等。针对问题表现,进行逐一排除,最终敲定故障点所在位置。(3)如果以上硬件故障都已经排除,那么就是计算机系统的故障,这一故障需要建立故障模型进行诊断,根据PMC模型进行定义。通过分层测试的方法,查找问题单元,即正常单元测试正常单元、正常单元测试故障单元、故障单元测试故障单元、故障单元测试正常单元等四种。其中后三种的检测结果都是故障,因此就可以通过分层测量的方式,建立有限个单元,通过矩阵以及萤火虫算法重点FAFD算法对于其他单元进行诊断,最终确定故障的系统是哪个或者哪几个单元的。当然也可以通过镜像、流量统计、抓包等其他手段确定故障所在的设备范围,进而缩小范围,集中处理某一个或者几个设备。(4)收集重要的数据信息。在进行故障处理时,通过收集设备的日志、诊断、操作记录等信息资料,将这些数据资料进行汇总,条件允许的情况下,建立故障数据库,对于常见问题可以做到“出现即处理”,对于没有出现过的故障,可以继续收集进数据库。总之,必要的信息收集,有利于日后更好的查找故障原因,确保数据中心网络健康、平稳运行。4结论随着当前社会的发展,计算机设备的运用越来越广泛,特别是在网络通讯技术的支持下,其为社会生活、各项事业的发展带来了极大的便利,因此,数据局中心网络稳定与否对于各项生产活动具有重要意义。本文结合计算机网络的专业知识,对于常见的通讯故障进行分析,以实践为基础对网络通讯故障的处置方案提出建议。参考文献[1]李彬,江虹.数据中心网络通讯故障分析与处理方法技术研究[J].信息通信,2017(12):97~98.[2]赵晨辉.基于Fat-Tree的数据中心网络负载均衡方法研究[D].北京交通大学,2017.[3]李霞,李虎,甘琤,等.服务器中高性能网络数据包处理方法的对比研究[J].计算机应用与软件,2017(11):177~183.[4]祖桂英,董晓慧,胥玲,等.计算机网络通讯技术故障分析与处理[J].通讯世界,2016(18):61~62.收稿日期:2018-12-24通信设计与应用141

本文来源:https://www.2haoxitong.net/k/doc/a63a129476232f60ddccda38376baf1ffd4fe348.html

《数据中心网络常见通讯故障分析与处理.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式