运维DBA的四大纪律九项注意( 二 )


运维DBA的四大纪律九项注意

文章插图
如果是企业缺少相应备份设备或软件导致的 ,  DBA 有义务督促领导购置恢复演练所需的软硬件设备 。因为一旦出现意外 ,  DBA 的直接领导往往也担不了这个责任 , 毕竟数据都保护不了 , 用户还怎么相信你这个企业 , 不论你是央企还是国企 。
运维 DBA 的九项注意
三大纪律是规矩(Rules) , 八项注意是指导原则() 。
做运维的人 , 不能总说这个我们没想到 , 哎呀 , 没想到这也不行 。这是爬雪山 , 过草地 , 不注意就陷进去了 , 哪里会留时间给你瞎 BB?
1、对生产环境心怀敬畏
你也许没听过“一个干翻 6 台 P595” , 你也许没听过“一个 cp 命令让营业系统停止使用 30 分钟” , 你也许没听过“建一个索引让所有核保业务不能用了” , 你也许没听过“我本来是要我的虚拟机的 , 没想关生产库”… …
你没听过的事情很多 , 你没干过的事情更多 , 因为你还年轻 。
但是一定要对生产环境心怀敬畏 。
所有操作命令不是网上搜来就可以用的 , 你要尽可能搞清楚这个命令的副作用 , 这个命令下去最坏的可能 , 可能是什么?不懂的就虚心求教 ,  DBA plus 社群这么多大牛 , 实在不好意思 , 就先砸个大红包过去再问 。
2、保持 24 小时开机
做运维的没有彻底休假之说 , 不要以为你休假了就关机大吉了 , 那离你关门大吉也不远了 。嗯 , 所以有些公司把这条也列为纪律之一 。
我曾遇到过这样一个情况 , 某个 DBA 请假了 , 刚好有个环境的密码只有他知道 , 而这个环境现在出了点问题 。可想而知 , 当时人是多么着急? 嗯 , 那个 DBA 休假回来就长时间离开现场了 。
3、多请应用的人唠唠嗑
完全不懂业务的 DBA 不是一个合格的架构师 。
要去懂业务、懂应用、懂服务 , 就一定要跟应用的人唠嗑、吃饭、抽烟 , 平时尊重人家 , 人家愿意跟你说 , 你就越来越熟悉业务 。慢慢的 , 你就可以为推动业务采用更合适的架构方案 。
4、不要在上班时间做普通变更
什么叫普通变更?就是你本来可以提前一天做的变更 。
比如扩表空间、增加用户权限、创建索引……并非是为了解决紧急故障而导致的变更 。
提前做好变更规划 , 尽量争取每次免考核时做完所有重要的变更 。
5、定期做好数据库检查
数据库没有发生故障 , 不代表是 DBA 做得好 , 而是故障自己还没有发生 , 不是不报 , 实时候未到 。
所以 , 确定好检查规则 , 定期做好数据库检查 , 并进行整改 。涉及到其它配合方的整改一定要邮件抄送 , 并电话确认 。
6、数据库部署要给予最小化权限
安装必要的最少组件 , 赋予必要的最小权限 , 是主动避坑的有效手段 。很多数据恢复 , 操作问题 , 如果能够从权限上把把关 , 后面就能省很多事情 。
7、所有的保障手段 , 都要去验证其持续可行性
说起来容易 , 做起来难 。全国 90% 的系统没有做到这一点 。所以你才会经常听到异常恢复的案例 。特别是哪些用存储容灾 , 或者用 OGG 应急的 。不是技术本身不行 , 而是管理不行 。