클라우드가 내려 오면 어떻게됩니까? 우리의 디지털 삶의 숨겨진 취약성
2025 년 6 월 12 일 오후 2시 47 분 태평양에서 실리콘 밸리를 가로 지르는 스타트 업 피치 데크가 중간에 얼어 붙기 시작했습니다. Google Cloud에 전적으로 구축 된 AI 기반 플랫폼은 단순히 사라졌습니다. 한 순간, 실시간 감정 분석 대시 보드는 데이터를 표시하고있었습니다. 다음으로, 타임 아웃 오류는 벤처 캐피탈 컨퍼런스 룸을 가로 질러 계단식이 발생했습니다.
이것은 고립되지 않았다. 70 개가 넘는 Google Cloud Services가 전 세계적으로 작업을 중단하여 CloudFlare, OpenAi 및 Shopify를 무너 뜨 렸습니다. 다운 데터는 첫 시간 내에 13,000 명 이상의보고 된 사건을 보여 주었다. API 관리 오류로 시작한 것은 AWS의 악명 높은 2017 년 붕괴 이후 업계 관측자가 가장 광범위한 클라우드 실패라고 불렀습니다.
여기에 문제가 있습니다 : 이것은 괴물 사고가 아니 었습니다. 그것은 제작에서 몇 년 동안 건축 카드 집의 증상이었습니다.
신뢰성에 대한 불편한 진실
숫자는 설탕 코팅하지 않습니다. 2024 년에 중요한 구름 정전은 18% 증가했습니다. Google Cloud 다운 타임은 57% 급증했습니다. AWS는 가장 신뢰할 수 있었지만 유치원으로 가득 찬 방에서 가장 높은 사람이되는 것과 같습니다.
InformationWeek의 2024 년 보고서에 따르면, IT 의사 결정자의 60%가 AWS를 사용하고 작년에는 절반에 직면했습니다. 반. 클라우드 신뢰도의 골드 표준은 여전히 기업 고객의 절반을 매년 방해합니다.
6 월 사건은 현대 클라우드 취약성을 완벽하게 설명했습니다. Google Cloud의 IAM (ID 및 액세스 관리 – 기본적으로 누가 액세스 할 수있는 사람을 결정하는 시스템) 또는 할당량 시스템에 의존하는 모든 서비스. 데이터 센터 화재 또는 지진이 아니라 다른 시스템을 관리하는 시스템의 소프트웨어 오류 인 제어 평면 버그에 의해. 하나의 구성 변경이 Google의 글로벌 인프라에서 몇 분 안에 전파되었습니다.
누군가가 중앙 제어 시스템을 잘못 업데이트했기 때문에 도시의 모든 신호등이 갑자기 잘못된 규칙에 따라 시작되었다고 상상해보십시오. 그것은 본질적으로 Google의 클라우드에 일어난 일입니다.
모든 것이 도미노처럼 떨어질 때
6 월 중단은 우리가 어떻게 서로 연결된 지에 대한 끔찍한 무언가를 노출시켰다. Shopify의 주식은 투자자가 도망 쳤을 때 3.01% 하락했습니다. Google의 신원 관리가 멍청 해졌 기 때문에 Chatgpt는 사용자를 인증 할 수 없었습니다. AI의 미래는 Mountain View의 구성 버그로 낮아졌습니다.
Gitlab, Replit, Elastic 및 수십 개의 다른 플랫폼이 서비스 마구간을 보았습니다. 새 코드를 테스트하고 배포하는 자동화 된 시스템 인 수천 개의 CI/CD 파이프 라인이 미드 릴리스를 조정합니다. 일부 회사는 전체 제품 출시를 잃었습니다.
개발자 커뮤니티는 Discord와 Reddit에서 녹았습니다. 일반적인 주제? 건축가들은 갑자기 자신의 “탄력적 인”클라우드 네이티브 디자인이 우아한 단일 고장 포인트를 만들었다는 것을 깨달았습니다.
나는이 패턴을 몇 달 동안 추적 해 왔으며 계속 반복하고 있습니다. 우리는 우리가 탄력성을 위해 구축하고 있다고 생각하지만, 우리는 단지 더 정교한 방법을 구축하고 있습니다.
당신의 스마트 홈은 그렇게 똑똑하지 않습니다
개인적으로 가자. 당신의 일상은 이제 클라우드가 불멸의 것으로 가정합니다. 그렇지 않은 경우 결과는 성가신 것에서 경보에 이르기까지 다양합니다.
2025 년 6 월에 구불 구불 한 전구 재난을 가져 가십시오. 고객 포럼은 스마트 조명에 수백을 소비 한 사람들의 불만으로 단순히 응답을 멈췄습니다. 야간 시프트 노동자들은 신중하게 시간이 걸린 조명 일정을 잃었습니다. 사람들은 자신의 집에서 스위치를 찾기 위해 손전등 앱이 필요했습니다.
키커는 다음과 같습니다.이 “스마트”장치에는 종종 현지 인텔리전스가 없습니다. 그들은 기기 인 척하는 클라우드 터미널입니다. 아마존의 Alexa Services가 지난 9 월에 딸꾹질을했을 때 수백만의 에코 장치가 비싼 서류가되었습니다. 인증이 시애틀에 살았 기 때문에 사용자는 현지에서 저장된 음악을 연주 할 수 없었습니다.
악화됩니다. 스마트 도어 잠금 장치는 정전 중에 사람들을 갇혔습니다. 보안 카메라는 어두워집니다. 연기 감지기는 모니터링 연결을 잃습니다. 우리는 깨지기 쉬운 항상 온라인 가제트를 위해 신뢰할 수있는 아날로그 시스템을 거래했습니다.
기업 웨이크 업 전화
6 월 정전의 회사 피해는 잔인한 이야기를 들려줍니다. 전자 상거래 플랫폼이 저하 될 때 주요 소매 업체는 수백만 명을 잃었습니다. 결제 프로세스는 Google의 결제 API에 의존했습니다. 의존적 인 경우 엔지니어는 실패 포인트를 고려하지 않았습니다.
제조 회사는 Google의 BigQuery (데이터 분석 서비스)가 다운되었을 때 정시에 재고 시스템이 붕괴되는 것을 보았습니다. 수요 예측에 대한 접근이 없다는 것은 조립 라인을 중단했다는 것을 의미했습니다. 파급 효과는 여러 주에서 공급 업체를 강타했습니다.
Google의지도 API가 실패했을 때 은행조차도 꼬집음을 느꼈습니다. 모바일 앱은 수천 개의 화난 고객 통화를 생성 한 “사소한”기능인 브랜치 위치를 표시 할 수 없었습니다.
패턴은 분명합니다. 작은 의존성처럼 보이는 것은 전체 비즈니스 운영을 넘어갈 수 있습니다.
아무도 언급하지 않는 집중 문제
Amazon, Microsoft 및 Google 컨트롤은 클라우드 시장의 약 65%입니다. 한 사람이 재채기를하면 인터넷은 폐렴을 잡습니다.
이 농도는 AI 붐 동안 폭발했습니다. SEC 제출은 GPU 액세스를 보장하기 위해 매년 수백만 달러를 투입하는 신생 기업을 보여줍니다. 이들은 파트너십이 아니라 서비스 수준 계약을 통해 디지털 의존성입니다.
유럽 공무원들은 개인적으로이를 “디지털 인프라 식민주의”라고 부릅니다. 그들은 틀리지 않습니다.
회사가 올바르게하고 있습니다
클라우드에있는 모든 사람의 성장은 아닙니다. Netflix는 의도적으로 “Chaos Monkey”로 자신의 시스템을 깨뜨립니다. 편집증이지만 작동합니다.
Shopify는 여러 클라우드 제공 업체에서 중요한 서비스를 복제합니다. 값비싼? 예. 효과적인? Google이 실패하면 핵심 플랫폼이 계속 실행되었습니다.
내가 본 가장 똑똑한 접근 방식은 몇 분 안에 공급자를 전환 할 수있는 “클라우드 공수”시스템을 구축하는 회사에서 비롯됩니다. 6 월에 구글이 추락했을 때 일부는 30 분 안에 AWS로 전환했습니다. 고객은 눈치 채지 못했습니다.
다가오는 것
우리는 계산을 향하고 있습니다. 정부 보고서는 주요 클라우드가 금융 시장 및 정부 서비스를 통해 계단식 시나리오를보고합니다. 하루 종일 AWS 중단으로 인해 미국 경제에 500 억 달러가 소요될 수 있습니다.
이 기술은 탄력성 시스템을 구축하기 위해 존재합니다. 그러나 탄력성은 더 선행하고 성장에 사로 잡힌 산업에서는 어려운 판매입니다.
현실 점검은 다음과 같습니다. 투자자는 이제 재해 복구 증거를 요구하며, 종종 회사가 누락 될 때 회사 평가를 절단합니다. 구름 혁명은 끝나지 않았지만 무모한 청소년기가 끝나고 있습니다.
당신의 움직임
그래서 당신은 무엇을 할 수 있습니까? 간단한 시작 :
중요한 데이터의 로컬 백업을 유지하십시오. 오프라인 모드가있는 앱을 사용하십시오. 비즈니스의 경우 모든 계란을 하나의 구름 바구니에 넣지 마십시오. 위험을 감수하십시오.
가장 중요한 것은 클라우드를 마법처럼 취급하지 마십시오. 다른 사람의 컴퓨터이고 컴퓨터가 끊어집니다.
다음에 스마트 전구가 켜지지 않을 때는 다음을 기억하십시오. 데이터 센터 어딘가에 클라우드가 다운되었습니다. 그리고 당신은 다른 사람의 디지털 현실에서 임차인 일뿐입니다.
문제는 다음 큰 중단이 일어날 지 여부가 아닙니다. 그것은 당신이 준비 될 것인지 여부입니다.
공개적으로 이용 가능한 사고 보고서, SEC 제출, 산업 조사 및 기술 문서를 기반으로 한 분석.



Post Comment