Github 가용성 보고서 : 2025 년 2 월
2 월에 우리는 두 건의 사건을 경험하여 GitHub 서비스에서 성능이 저하되었습니다.
2 월 25 일 14:25 UTC (2 시간 19 분 지속)
2025 년 2 월 25 일, 14:25 UTC에서 16:44 UTC 사이에 이메일 및 웹 알림은 전달 지연을 경험했습니다. 사고의 최고점에서 지연으로 인해 모든 알림의 ~ 10%가 10 분 이상 전달되었으며 나머지 ~ 90%는 5-10 분 이내에 전달되었습니다. 이 사건은 피크 시간에 용량에 너무 가까운 작업자 풀이 발생하여 대기열 처리가 지연되어 발생했습니다.
우리는 수요를 충족시키기 위해 서비스를 확장하여 사건을 완화했습니다. 우리는 더 이상 지연이 발생하지 않도록 더 높은 기준 용량을 확립했으며 앞으로 수영장을 사전에 관리 할 수있는 역량 계획을 개선하고 있습니다.
2 월 3 일 18:01 UTC (30 분 지속)
2025 년 2 월 3 일, 18:01 UTC에, 마이그레이션 도구의 실패로 인해 사건이 선언되었습니다. 근본 원인은 시스템 구성 요소의 배치로 추적되어 Docker 이미지가 누락 되어이 창에서 마이그레이션을 시도하는 모든 사용자에게 100% 정전이 발생했습니다. 이 문제는 이전 안정 버전으로 롤백하여 약 30 분 이내에 서비스를 복원함으로써 완화되었습니다.
우리는 중요한 종속성의 검증을 보장하기 위해 테스트 범위와 워크 플로를 향상 시켰습니다.
상태 변경 및 사후 요약에 대한 실시간 업데이트는 상태 페이지를 따르십시오. 우리가 작업하는 일에 대한 자세한 내용은 Github 엔지니어링 블로그를 확인하십시오.
작성자가 작성했습니다
Post Comment