Amazon Aurora Restart, Failover가 일어나는 경우

지난 AWS에서 진행한 Database Roadshow 2022 in Seoul 세션에서 다뤘던 내용인데, 2달만에 짬이 좀 나서 정리해본다.

Amazon Aurora Monitoring and Troubleshooting 세션 시간에 다루어진 내용이고 DB 재부팅, 페일오버(장애조치)가 일어나는 원인들은 아래와 같다.

  • Health check failing on resource pressure
  • Reader replication lag behind from writer
  • Reader instances restart on writer restart or failover
  • Scheduled maintenance tasks
  • AWS Infrastructure Issue
  • Storage IO stuck
  • Aurora service, database engine bugs