解决Mysql生产事故的通用方法高级DBA真实案例解答全网唯一
国内90%的生产数据库用的最多的就是MySql数据库。企业软件生产环境通常情况下,都有一主一从,或者一主多从的HA高可用架构。结合作者本人实际经验结合一个实际的生产数据库宕机的例子,来讲解应该用怎么样的思路去解决问题。在生产事故过程中,有那些注意的关键点。
作者本人简介:现任国内某大型软件公司大数据研发工程师、MySQL数据库DBA,软件架构师。直接参与设计国家级亿级别大数据项目。并维护真实企业级生产数据库300余个。紧急处理数据库生产事故上百起,挽回数据丢失所操作的灾难损失不计其数。
本文拿一个真正生产案例MYSQL宕机的实际案例做讲解,主要是叙述解决问题的思路跟方法,毕竟真正解决生产数据库事故的研发人员也是极少的。
一、遇到生产级别的数据库事故第一步需要怎么做?
第一步先去生产服务器去检查数据库备份是否完整,通过查看生产数据库的备份文件的大小判断。先理性的判断,如果数据丢失了,会造成多大的损失,数据可以全量恢复到什么时间段。比如1天前,或者几小时前。对事故做一个初步的预估,最坏的情况跟最好的情况。判断事故的严重性,这一步会影响后面的解决问题的操作的
二、通过数据库日志、应用日志判断寻找问题的线索
查看my.cnf或者my.ini判断运行日志跟错误日志的位置,如果没有配置,则可以配置上,再重启数据库。
[mysqld