DeepSeek은 주장한 것만 큼 파괴적이지 않을 수도 있고, 회사는 5 만 NVIDIA GPU를 보유하고 있으며 Buildouts에 16 억 달러를 소비했습니다.
중국의 스타트 업 DeepSeek은 최근 DeepSeek가 6 백만 달러와 6 백만 달러에 불과하고 회사의 주장에도 불구하고 Open AI의 O1과 경쟁력이 있다고 여겨지는 R1이라는 고급 AI 모델에 대한 Compute Resources의 놀랍도록 낮은 Compute Resources 사용으로 기술 세계에서 중심 무대를 차지했습니다. 훈련 할 2,048 GPU. 그러나 업계 분석가 회사 반달 DeepSeek 뒤에있는 회사는 16 억 달러의 하드웨어 비용을 발생했으며 50,000 NVIDIA HOPPER GPU의 함대를 보유하고 있는데, 이는 DeepSeek가 AI 업계의 리더보다 AI 훈련과 극도로 낮은 투자에 대한 추론을 재창조했다는 아이디어를 훼손한 결과입니다.
DeepSeek은 약 50,000 호퍼 GPU의 광범위한 컴퓨팅 인프라를 운영하고 있다고 보고서는 주장했다. Semianalysis에 따르면 10,000 H800 및 10,000 H100S가 포함되며 H20 단위를 추가로 구매할 수 있습니다. 이러한 리소스는 여러 위치에 배포되며 AI 교육, 연구 및 재무 모델링과 같은 목적으로 제공됩니다. Semianalysis에 따르면이 회사의 서버에 대한 총 자본 투자는 약 16 억 달러이며 운영 비용에 9 억 9,400 만 달러가 소비 된 것으로 추정됩니다.
DeepSeek은 미국 기반 모델과 비교할 때 크게 낮은 DeepSeek-V3 Mix-of-Experts (MOE) AI 모델의 미세한 하드웨어 요구 사항을 공개했을 때 AI 세계의 주목을 받았습니다. 그런 다음 Deepseek은 열린 AI 경쟁 R1 AI 모델로 첨단 세계를 흔들 었습니다. 그러나 평판이 좋은 Market Intelligence Company Semianalysis는 회사가 약 16 억 달러 상당의 하드웨어 투자를 보유하고 있음을 나타냅니다.
DeepSeek은 AI를 조기에 채택하고 GPU에 많은 투자를하는 중국 헤지 펀드 인 High-Flyer에서 시작됩니다. 2023 년에 High-Flyer는 AI에만 초점을 맞춘 별도의 벤처로 Deepseek을 시작했습니다. 많은 경쟁 업체와 달리 DeepSeek은 자체 자금을 지원하여 의사 결정의 유연성과 속도를 제공합니다. Semianalysis에 따르면이 회사는 사소한 파생물이라는 주장에도 불구 하고이 회사는 5 억 달러 이상의 기술에 투자했다.
DeepSeek의 주요 차별화 요소는 외부 클라우드 제공 업체에 의존하는 대부분의 다른 AI 스타트 업과 달리 자체 데이터 센터를 실행하는 능력입니다. 이러한 독립성을 통해 실험 및 AI 모델 최적화를 완전히 제어 할 수 있습니다. 또한 외부 병목 현상없이 빠른 반복을 가능하게하여 업계의 전통적인 플레이어에 비해 심도가 매우 효율적입니다.
그런 다음 중국 회사에서 기대하지 않는 것이 있습니다. 중국 본토에서의 인재 인수, 대만이나 미국의 밀렵이 중국 내에서 독점적으로 고용하지 않고 공식적인 자격 증명보다는 기술과 문제 해결 능력에 중점을두고 있습니다. 반달. 채용 노력은 Peking University 및 Zhejiang University와 같은 기관을 대상으로하며 경쟁이 치열한 급여를 제공합니다. 이 연구에 따르면 DeepSeek의 일부 AI 연구원들은 130 만 달러 이상을 벌어 Moonshot과 같은 다른 주요 중국 AI 회사에서 보상을 초과했습니다.
인재 유입으로 인해 DeepSeek은 MLA (Multi-Head Prenatent Interection)와 같은 혁신을 개척하여 수개월의 개발 및 상당한 GPU 사용이 필요했습니다. DeepSeek은 Brute-Force 스케일링에 대한 효율성과 알고리즘 개선을 강조하여 AI 모델 개발에 대한 기대치를 재구성합니다. 이 접근법은 여러 가지 이유로 빠른 발전으로 인해 고급 GPU에 대한 수요가 줄어들어 NVIDIA와 같은 회사에 영향을 줄 수 있다고 믿었습니다.
DeepSeek이 최신 모델을 6 백만 달러에 훈련 시켰다는 최근의 주장은 과대 광고의 상당 부분을 불러 일으켰습니다. 그러나이 수치는 총 교육 비용의 일부, 특히 사전 훈련에 필요한 GPU 시간만을 나타냅니다. 연구, 모델 개선, 데이터 처리 또는 전체 인프라 비용을 설명하지 않습니다. 실제로 DeepSeek은 처음부터 AI 개발에 5 억 달러 이상을 지출했습니다. 관료주의에 의해 부담이되는 대기업과는 달리, DeepSeek의 린 구조는 AI 혁신에서 적극적으로 전진 할 수있게 해줍니다.
Deepseek의 Rise는 잘 자금을 지원 받고 독립적 인 AI 회사가 업계 리더들에게 어떻게 도전 할 수 있는지 강조합니다. 그러나 대중의 담론은 과대 광고에 의해 주도되었을 수 있습니다. 현실은 더 복잡합니다 : 반달 분석은 DeepSeek의 성공이 수십억 달러, 기술 혁신 및 경쟁력있는 인력에 대한 전략적 투자를 기반으로한다고 주장합니다. 그것이 의미하는 바는 불가사의가 없다는 것입니다. 엘론 머스크 (Elon Musk)가 1 년 정도 전에 언급했듯이, AI에서 경쟁력을 갖기를 원한다면 연간 수십억 달러를 소비해야합니다.
Post Comment