1.看日志。排查故障看日志,根据日志分析和解决问题很关键。
2.处理问题和解决问题关键看思路,思路很重要。遇到故障多分析,处理问题一定要快速和准确。
3.服务器的日志中,时钟格式需要调整成CST-8。设置方法:DELL 服务器IDRAC界面--IDRAC设置--属性--设置时区和NTP--设置时区为:亚洲/上海。
4.升级系统之前做好准备,备份配置文件,然后停止服务,并且一定要做好回退的准备措施。
5.时钟同步/sbin/ntpdate cn.pool.ntp.org > /dev/null 2>&1,最好做成计划任务,定时同步时钟。
6.输入Linux命令时,不要在命令中带有密码。比如:mysql -uroot -p 或者Oracle DB用户的登录:sqlplus sys/XXX@$Instance_name as sysdba;
7.做系统升级的时候,如果有Keepalived高可用配置,需要事先通过ip addr show dev ethX查看Keepalived的VIP所在的Real Server。先升级另外一台VIP不存在的Real Server,然后再切换VIP,使VIP漂移到已经更新的系统。这样,对业务的影响小,业务一般不会中断。
8.CentOS7.X的系统中开启自启动的脚本如果加入/etc/rc.d/rc.local文件中,需要先确保rc.local的执行权限。授权的命令是:chmod +x /etc/rc.d/rc.local。
9.安装Zabbix-agent的时候,需要把Client端的SELinux关闭,否则从Zabbix Server端通过zabbix_gets命令抓不到客户端数据。
10.工作中要养成写博客和整理日志的习惯,并且要经常管理博客内容,删除灌水帖子和用户,保证博客的文章质量。
11.对于VMware Esxi中的虚拟机,操作前尽量先对当前状态做快照,以免出现问题后无法恢复到当前状态。
12.去客户现场一定要保持和公司总部、公司其他同事的通讯畅通,并且工作的时候不要轻易将手机的充电器和数据线等外借,否则遇到紧急情况需要这些的时候,无法处理。
13.有些服务器需要外置RAID卡控制器,部署系统遇到控制器报错,需要查看RAID卡的情况。比如联想ThinkServer RD450安装CentOS6.5系统需要安装外置RAID卡控制器并且需要重做RAID。
14.排查网络设备故障,先排查网络设备的入口线,再排查接入网络终端的情况。排查网络故障的过程中,一定要记住各种网络连线的接口和位置。
15.退出telnet命令行,输入ctrl+]组合键,再输入quit可以退出。
16.Windows系统中要记住2个命令:shutdown.exe -s -t 0立即关机,shutdown.exe -r -t 0立即重启。
17.一定要找准配置文件,这是系统应用生效的前提。
18.安装操作系统之前最好初始化磁盘的数据,并且做好RAID。RAID做完后,一定要清除数据,并且在RAID设置界面选定好启动设备。
19.拿光盘的时候一定要注意使用正确的方法,不要划盘,否则光盘里面的数据用不了。
20.Nginx WEB Server修改配置后执行重启操作,最好要执行reload配置文件并且杀掉nginx进程后重启nginx。
21.服务器或者电脑,一定要避免硬关机。否则容易对主板的电源模块造成影响,电脑或者服务器无法开机。
22.编辑或者修改完任何文件后一定要注意立即保存,避免突然关机或者临时有事造成的文件未保存问题。
23.VMware Workstation上的云主机,一定不要非正常关机,否则会开机后显示修复系统,需要很长时间修复系统。
24.如果MySQL数据库中的字符集使用的是UTF8,那么最好使用的登录语句:mysql -uroot -p --default-character-set=utf8
25.CentOS 一定要开启BIOS的虚拟化技术VT(Virtual Technology),如果不开启,默认虚拟化是QEMU,QEMU是完全虚拟化技术。开启了BIOS的VT技术,那么底层使用KVM半虚拟化方式,能够提高虚拟机的性能。
26.监控工具上的告警信息一定要及时解决。
27.负载均衡LB+高可用HA是企业应用必须要考虑的问题,尽量避免单点故障。
28.云计算发展从IS,PS,SS向云计算集成运营能力转变,提供智慧城市技术支持是云计算的发展方向。
29.时钟同步中,如果需要从本机时钟同步授权给局域网内的其他主机,那么需要修改NTP的配置文件/etc/ntp.conf:
server 127.127.1.1
fudge 127.127.1.1 stratum 10
或者:
server 127.127.1.0
fudge 127.127.1.0 stratum 10
restrict 127.127.1.0
如果在CentOS7的系统中需要修改/etc/chronyd.conf:
server 127.127.1.1
local stratum 10
30.物理服务器内存的插法:CPU00/CHANNEL02/DIMM00代表CPU00/第三个通道/第一根内存条,如果在主板上有P1-A~C和P2-A~C的内存编号,那么CPU00/CHANNEL02/DIMM00表示第一颗CPU的第三个通道C的第一个内存条,一般是P2-C代表的内存条。
31.一定要对自己工作范围内掌握的设备使用和属性做到了如指掌。这样出现故障后,才能及时解决,不用查询表格。
32.工作中出差需要乘飞机的时候,需要注意有些东西不能带,比如:剃须刀片、牙膏。
33.ethtool -p eth0回车后与eth0 相对应的网卡接口旁边的指示灯就会闪烁,这样你就能很快确定eth0 网口的位置啦。(按下Ctrl+C 结束命令,停止闪烁)。
34.网络传输会占满磁盘I/O导致vmware workstation的网络不通。
35.libvirtd 服务无法启动需要确认resolv.conf里面的DNS,有可能因为没有配置DNS导致无法启动服务。
36.工作中一定要记录工作相关的各种密码,并且输入密码的时候确认好键盘的大小写,一遍输入正确。
37.一定要设置服务器的IPMI,这样可以通过远程管理服务器的电源。
38.部署完Ovirt平台一定要执行:engine-backup --mode=backup --file=he.bak --log=helog.txt
39.练习歪门邪道的功夫,很快便能小有成就,但永远成不了高手。而名门正派的武功虽然入门艰辛,进步缓慢,却是成为一代宗师的必由之路。
40.可以通过yum install ipmitool -y去安装ipmi远控卡工具,通过ipmitool lan print在CentOS系统里面查看IDRAC的远控卡地址,然后通过服务器后面的IDRAC卡连接服务器。
41.升级了存储设备的固件后,有可能造成LUN的UUID变动的情况,需要注意,否则业务无法连接多路径的存储设备。
42.工作中一定要忽略甲方和乙方的界限,作为甲方不要把所有的事情都推给乙方,同时乙方一定要在自己服务范围内做好本职的事情。
43.产品的设计一定要以易用为主,并且满足客户的修改配置需求。
44.使用替换法查找网络问题,比如光纤口或者网线和网口有故障,可以使用替换法把网线插到其他网口或者替换光纤接口来使网络正常。
45.服务器修复模式或者默认系统只是UP一个网口,其他的默认是DOWN状态。
46.如果检查光纤网卡或者光纤线是否有故障,需要看网卡或者网线连接网卡后是否有光,但是一定不要把光对着自己的眼睛,以免灼伤。
47.默认安装的Nginx web server不具有pcre的支持Nginx的rewrite模块。
48.Linux系统为了登录方便,最好开启SSH互信。具体命令是:#ssh-keygen -t rsa,然后执行ssh-copy -i ~/.ssh/id_rsa.pub IP地址 ,输入密码。
49.使用刻录机刻录光盘之前一定要检验文件是否可用,如果是.exe可执行文件,一定要事先双击下,看下能否执行打开。
50.一般使用screen命令进行多窗口切换,新建窗口命令是:#screen -S linxi;查看窗口的ID的命令为:#screen -ls;恢复窗口的命令为:screen -r ID。
51.Openstack一定不要在控制节点打开openstack-nova-compute服务,并且不能把云主机创建在控制节点上。
52.可以在服务器上执行命令搭建WEB服务器:python -m SimpleHTTPServer 8080,访问时候在浏览器地址栏输入
http://IP:8080/。
53.如果不希望DNS被改变,需要在/etc/resolv.conf里面配置DNS,并且要在网卡配置文件里面添加上PEERDNS=no.
54.可以通过截取日志的方式进行查看日志:sed -n '/2018-05-10 10:25/,/2018-05-10 10:32/p' nova-compute.log
55.在面试或者是工作中,请保管好自己的办公用品,尤其是签字笔。因为在面试过程中很多考官喜欢用你的签字笔讲解内容,然后顺手牵羊。工作中,很多同事懒得自己买笔,直接用别的同事的。
56.工作中一定要对网络设备,尤其是路由器、交换机、防火墙进行严格管理,包括端口使用、vlan 划分、区域划分。并且配置上管理地址和snmp,适合远程管理和查看流量状况,有利于分析网络情况。
57.在项目部署阶段一定要注意多备齐需要的网线和光纤线。并且宁可长度超标,不能长度不够。否则在项目部署过程中再去购买网线和光纤线将会严重影响项目进度。所使用的网线和光纤线一定事先使用网络测线仪测试好连通性。
58.必须在自己可以管理和登录的服务器系统内创建属于自己的私人管理员权限账号并且设置复杂的用户密码。因为这样一旦以后root用户改密码后,还可以保证自己能通过远程登录到系统内。
59.做工作一定要注重效率和执行力,把事情在最短时间完成,并且要有反馈。
60.Oracle 软件是区分大小写的,也就是对大小写敏感,所以字段一定要大写。
61.在使用Linux系统的时候,一定要关闭selinux,最好能在/etc/profile的末尾添加上setenforce 0,并且修改/etc/selinux/config文件里面的SELINUX=disabled。
62.一定要记录好每天工作内容、考勤、补助、报销状态等信息。
63.