대대적인 해체: 물리적 데이터 센터의 서버에 작별 인사
[Ed. note: While we take some time to rest up over the holidays and prepare for next year, we are re-publishing our top ten posts for the year. Please enjoy our favorite work this year and we’ll see you in 2026.]
부터[–>October 2010 모든 Stack Exchange 사이트는 뉴욕 시(뉴저지)에 있는 데이터 센터의 물리적 하드웨어에서 실행되었습니다. 이들은 우리 역사와 마음속에 따뜻한 자리를 갖고 있습니다. 제가 처음 회사에 입사하여 뉴욕 사무실에서 근무할 때, 사랑하는 애완동물처럼 칭찬패가 벽에 설치된 원본 서버를 보았습니다. 수년에 걸쳐,[–>we’ve shared glamor shots 서버 랙 및 업데이트 정보.
거의 16년 동안 SRE 팀은 물리적 서버, 케이블 연결, 랙 설치, 고장난 디스크 교체 및 그 밖의 모든 것을 포함한 모든 데이터 센터 운영을 관리해 왔습니다. 이 작업을 수행하려면 누군가 데이터 센터에 직접 나타나 기계를 찔러야 했습니다.
이후 우리는 모든 사이트를 클라우드로 옮겼습니다. 우리 서버는 이제 애완동물이 아닌 소입니다. 누구도 뉴저지 데이터 센터로 운전해서 하드웨어를 교체하거나 재부팅할 필요가 없습니다. 지난주 이후에는 없습니다.
그 이유는 7월 2일에 데이터 센터 폐쇄를 예상하여 모든 서버의 랙을 풀고 모든 케이블을 뽑은 후 한때 강력했던 이 기계에 마지막 커튼 콜을 했기 때문입니다. 지난 몇 년 동안 우리는 클라우드를 수용하고 인프라를 완전히 클라우드로 이전할 계획을 세워왔습니다. 우리는 2023년에 Teams용 Stack Overflow를 Azure로 이전하고 이를 수행할 수 있음을 입증했습니다. 이제 우리는 공개 사이트(Stack Overflow 및 Stack Exchange 네트워크)만 다루면 되었습니다.[–>hosted on Google Cloud. 작년 초, 뉴저지에 있는 데이터 센터 공급업체는 해당 위치를 폐쇄하기로 결정했고, 우리는 2025년 7월까지 폐쇄해야 했습니다.
콜로라도에 있는 다른 데이터 센터는 6월에 폐쇄되었습니다. 이는 주로 재해 복구를 위한 것이었지만 더 이상 필요하지 않았습니다. Stack Overflow에는 더 이상 물리적 데이터 센터나 사무실이 없습니다. 우리는 완전히 클라우드에 있고 원격에 있습니다!
이를 현실화하는 데 도움을 준 다른 많은 사람들과 함께 SRE 팀에 큰 찬사를 보냅니다. 곧 Stack Exchange 사이트를 클라우드로 마이그레이션하는 방법에 대해 이야기할 블로그가 몇 개 있을 예정입니다. 지금은 사진을 즐겨보세요.
이 위치에는 모두 약 50개의 서버가 있었습니다. 하루가 시작될 때 서버의 모습은 다음과 같습니다.


기계당 8개(또는 그 이상)의 케이블에 50개 이상의 기계를 곱하면 엄청난 양의 케이블이 됩니다! 위 사진을 보면 엄청난 양의 케이블이 보입니다. 서버당 하나씩 작은 케이지(“암”이라고 함)에 깔끔하게 포장되어 있지만 너무 많은 호스트의 케이블을 분리하는 데는 많은 작업이 필요했습니다.
왜 기계당 케이블이 그렇게 많습니까? 다음은 개별 케이블을 개별적으로 보여주는 단계별 사진입니다.
- 파란색: 관리 네트워크(원격 액세스)용 1x 1G 이더넷 케이블.
- 검정색: VGA 비디오 및 USB(키보드 및 마우스) 신호를 “KVM 스위치”로 전달하는 케이블 1개. KVM 스위치를 통해 데이터 센터에 있는 모든 시스템의 키보드/비디오/마우스에 연결할 수 있습니다. 비싸지만 그만한 가치가 있었습니다. 긴급 상황이 발생하면 집을 떠나지 않고도 항상 “기계 앞에” 있을 수 있습니다.
- 빨간색: 메인 네트워크에 연결되는 10G 이더넷 케이블 2개.
- 검정색: 기본 네트워크에 2배 더 많은 10G 이더넷 케이블이 연결됩니다(SQL 서버와 같이 추가 대역폭이 필요한 시스템에만 해당).
- 흰색+파란색: 전원 케이블 2개(중복성을 위해 각각 다른 회로에 연결)
하드웨어 전문가라면 이 점을 높이 평가할 것입니다. 그러나 그것들을 분해할 시간이 왔습니다. 우리 직원 사이트 안정성 엔지니어인 Josh Zhang은 약간 아쉬운 마음을 느꼈습니다. “저는 몇 년 전에 계획된 업그레이드의 일환으로 새로운 웹 계층 서버를 설치했습니다.”라고 그는 말했습니다. “그들을 비난하는 사람이 바로 나라는 사실이 씁쓸하다.” IT 버전입니다 올드 옐러.
대부분의 데이터 센터 종료에는 특정 시스템을 보존하여 새 데이터 센터로 이동하는 것이 포함된다고 가정합니다. 그러나 우리의 경우에는 모든 기계가 폐기되었습니다. 이를 통해 우리는 빠르게 움직이고 물건을 부술 수 있는 자유를 얻었습니다. 우리 안에 있었다면 폐기업체로 가는 거였죠. 보안상의 이유로(그리고 모든 사용자와 고객의 PII를 보호하기 위해) 모든 것이 파쇄 및/또는 파기되었습니다. 아무것도 지켜지지 않았습니다. 당사의 신뢰성 엔지니어링 이사인 Ellora Praharaj는 “더 이상 친절할 필요가 없습니다”라고 말했습니다.

랙 정리에는 두 단계가 있습니다. 먼저 모든 시스템의 케이블을 분리한 다음 랙을 해제합니다. 다음은 케이블이 분리된 일부 랙입니다. 구할 수 있는 것은 모두 제거되었습니다. 그러므로 우리는 깔끔할 필요도, 조심할 필요도 없었습니다. 여기서는 케이블 분리의 다양한 단계에 있는 랙을 볼 수 있습니다. 그 후 케이블 덩어리가 큰 더미로 옮겨졌습니다.

RJ45 케이블을 분리하는 데 어려움을 겪은 적이 있습니까? 글쎄, 여기에 작은 탭이 플러그를 풀지 못하는 이유를 알아내는 대신 빌어먹을 것들을 잘라낼 수 있는 기회가 있었습니다.

쓰레기 더미. 우리의 케이블 분리 과정에는 우리가 유일한 출구를 막고 있다는 사실을 깨달을 때까지 모든 것을 방 구석에 던지는 작업이 포함되었습니다. 그런 다음 우리는 더 넓게 쌓지 않고 더 높이 쌓았습니다.

모든 서버와 네트워크 장치는 바닥에 쌓여 있었습니다. 총 7개의 더미입니다.

이것은 우리가 이 모든 것을 구축했던 2015년의 “이전” 사진인가요, 아니면 모든 것을 해체했을 때의 “이후” 사진인가요? 추측해 보겠습니다!

사진과 정보를 제공해 주신 Ellora Praharaj, Tom Limoncelli, Josh Zhang에게 큰 감사를 드립니다. 그리고 무거운 짐을 들기 위해.



Post Comment