运维最痛苦的事莫过于,你在这头,终端在那头,你们中间隔着…………网络不可达。
网络的可达性是运维的基础,但我们遇到的故障常常是这样的
听到请回答
为了解决这个问题,需要借用到网络的七层模型。
针对物理层,我们可以通过交换机检查相关端口状态和网络连接情况,替换网口定位故障点在那里。
对于数据链路层,开不是每个交换机端口都一样,划分的VLAN不一样,或是端口有相应的策略虽然端口能起来,但也不一定能出得去,这一点要注意一下。
对于服务器的查看可以借助ethtool 网卡名,这个比较有用,可以判断端口的连接状态,并且可以查看端口对应的不同速率,再根据不同速率的起来状况,判断端口的对应关系,这个对于服务器上的多网卡比较有用。
40g的光口没有连接
网络层主要是检查对应的ip配置有没问题,这些比较常规,对照网上就可以。
但启动网卡过程中,有时会遇到网卡起不来的报错,特别是多网卡
悲剧的网卡
这种网卡起不来的故障的原因通常如下:
1 网卡配置文件出错
a 写多或是写少了东西,特别是DEVICE=后面的设备名称
b没有写onboot=yes
cMAC地址跟70文件没对应上错了
2 70文件没对应上对应的网卡
3做了网卡绑定,但里面的配置错误
4 ip冲突,跟别的地址重复
对于这种起不来的通常我们有几个文件需要查看一下
/etc/udev/rules.d/70-persistent-net.rules(这个文件定义了设备与mac的对应关系,设备与MAC要对应上)
/etc/sysconfig/network-scripts/*(涉及的网卡配置信息要核对,包括MAC地址对应关系)
/sys/class/net/${ETH}/address (这个文件记录了MAC的对应设备关系)
最终是为了对应上mac和设备的关系,正常的话service network restart可以起来。
搞定了网络上的连接性,下面总该可以了吧,但是,但是,有可能你死活ssh不上,下面我们继续处理应用的连通性。
一般我们先简单测试一下对应的端口,telnet 目标IP 端口
通,那么我们要检查一下ssh的配置文件,一般看以下几个地方:
监听端口有没有开放,比如全开
开放全部地址
监听端口对不对
不通
重点检查防火墙,放行对应的ip和端口
还有一种情况是你曾经登陆过,后面key保存了,那么你需要清空对应的key的ip项,重新登陆就可以
/root/.ssh/know_hosts
通过以上步骤,通常你就可以继续苦逼的到远端运维了,恭喜你。