GitHub 가용성 보고서: 2025년 10월
10월에는 GitHub 서비스 전반에 걸쳐 성능 저하를 초래하는 4건의 사고가 발생했습니다.
10월 9일 14:45 UTC (1시간 55분 동안 지속)
2025년 10월 9일 14:35 UTC부터 15:21 UTC 사이에 수리 중이던 유지 관리 모드의 네트워크 장치가 수리가 완전히 완료되기 전에 다시 생산에 들어갔습니다. 이 장치를 통과하는 네트워크 트래픽에서 상당한 패킷 손실이 발생했습니다.
github.com UI의 인증된 사용자는 사건 발생 후 처음 5분 동안 지연 시간이 증가하는 것을 경험했습니다. API 사용자는 최대 7.3%의 오류율을 경험했으며 이후 완화될 때까지 약 0.05%로 안정화되었습니다. 작업 서비스에서는 실행의 24%가 평균 13분 동안 지연되는 현상을 경험했습니다. LFS(대형 파일 저장소) 요청에서는 오류율이 최소한으로 증가하여 요청 오류가 0.038%로 나타났습니다.
유사한 문제를 방지하기 위해 이 범주의 장치 수리에 대한 검증 프로세스를 강화하고 있습니다.
10월 17일 13:11 UTC (1시간 1분 동안 지속)
2025년 10월 17일 12:51 UTC부터 14:01 UTC까지 총 70분 동안 모바일 푸시 알림이 전달되지 않았습니다. 이는 모든 지역의 github.com 및 GitHub Enterprise Cloud에 영향을 미쳤습니다. 중단은 모바일 푸시 알림 전달에 사용되는 클라우드 리소스에 대한 잘못된 구성 변경과 관련이 있습니다.
향후 이러한 사고를 방지하기 위해 이러한 클라우드 리소스에 대한 절차와 관리를 검토하고 있습니다.
10월 20일 08:56 UTC (2시간 5분 동안 지속)
2025년 10월 20일 08:05 UTC부터 10:50 UTC 사이에 Codespaces 서비스의 성능이 저하되었으며 사용자가 새로운 코드 공간을 생성하고 기존 코드 공간을 재개하는 데 실패했습니다. 평균적으로 코드 공간 생성에 대한 오류율은 39.5%였으며 인시던트 창 동안 서비스에 대한 요청의 71%로 최고에 달했습니다. 재개 작업 오류율은 평균 23.4%, 최고 오류율은 46%였습니다. 이는 devcontainer 이미지를 빌드하는 데 필요한 타사 종속성의 중단으로 인해 발생한 계단식 오류로 인해 발생했습니다.
타사 종속성이 복구되면 영향이 완화되었습니다.
우리는 이러한 종속성이 더 이상 컨테이너 빌드 프로세스에서 중요한 경로가 되지 않도록 옵션을 평가하고 있으며 향후 유사한 문제의 감지 시간을 줄이기 위해 모니터링 및 경고를 개선하고 있습니다.
10월 29일 16:17 UTC (6시간 58분 동안 지속)
2025년 10월 29일 14:07 UTC부터 23:15 UTC 사이에 GitHub는 제3자 공급자의 광범위한 중단으로 인해 서비스 저하를 경험했습니다. Codespaces 사용자는 사고 기간 동안 모든 지역에서 오류율이 평균 90%, 최고 100%에 달하는 심각한 연결 문제에 직면했습니다. GitHub Actions의 대규모 호스팅 실행기 또한 영향을 받아 워크플로의 0.5%와 대규모 실행기 작업의 거의 10%가 실패하거나 5분 이상 지연되었습니다. 작업 영향은 UTC 20:40까지 복구되었습니다. GitHub Enterprise Importer 서비스도 영향을 받아 git 푸시 작업 중에 마이그레이션이 실패하고 마이그레이션 처리가 크게 지연되었습니다. 또한 데이터 레지던시가 포함된 GitHub Enterprise Cloud에 대한 새로운 평가판이 지연되고 Copilot Metrics API 다운로드를 사용할 수 없어 UTC 20시 25분경에 복구가 시작될 때까지 약 100개의 요청이 실패했습니다.
영향을 줄이기 위해 사고 전반에 걸쳐 완화 조치가 적용되었지만 서비스 제공업체가 중단을 해결한 후에야 완전한 복구가 이루어졌습니다. GitHub는 이제 외부 공급자에 대한 중요한 경로 종속성을 줄이고 유사한 이벤트 중에 서비스를 적절하게 저하시키는 전략을 구현하는 데 중점을 두고 있으며 향후 중단에 대한 복원력을 향상시키는 것을 목표로 하고 있습니다.
상태 변경 및 사후 요약에 대한 실시간 업데이트를 보려면 상태 페이지를 팔로우하세요. 우리가 진행 중인 작업에 대해 자세히 알아보려면 GitHub 블로그의 엔지니어링 섹션을 확인하세요.
작성자:



Post Comment