아무도Who는 로컬 장치용 SLM을 통해 Big Tech의 클라우드 AI에 도전하기 위해 200만 유로를 모금했습니다.

아무도Who는 로컬 장치용 SLM을 통해 Big Tech의 클라우드 AI에 도전하기 위해 200만 유로를 모금했습니다.

소규모 북유럽 팀이 SLM(Small Language Models)을 사용자 장치에 직접 도입하여 Big Tech의 클라우드-LLM 지배력에 도전하면서 AI에서 다윗 대 골리앗의 변화가 나타나고 있습니다.

코펜하겐에 본사를 둔 오픈 소스 스타트업인 NothingWho는 사전 시드 자금으로 200만 유로를 모금했습니다.

이 회사는 오늘날의 대규모 클라우드 기반 LLM에 대한 비용 효율적이고 데이터 안전하며 기후에 맞는 대안으로 소규모 언어 모델을 옹호함으로써 글로벌 AI에서 유럽의 입지를 강화하는 것을 목표로 합니다.

저는 창업자 겸 CEO인 Cecilie Waagner Falkenstrøm과 이에 대해 자세히 알아보았습니다.

NobodyWho는 수상 경력이 있는 기업가이자 예술가인 Cecilie Waagner Falkenstrøm이 설립했으며, 그의 선구적인 대화형 AI 작업은 2016년으로 거슬러 올라갑니다. 공동 창립자이자 CTO인 Asbjørn Olling 및 소프트웨어 엔지니어 팀과 함께 그녀는 UN 의뢰 프로젝트부터 NASA의 국제 우주 정거장에서의 2021년 엣지 AI 실험에 이르기까지 로컬 AI 기술을 발전시키는 데 거의 10년을 보냈습니다.

오늘날의 클라우드 기반 LLM은 소수의 비유럽 거대 기술 기업에 의해 관리되며 대규모 컴퓨팅 리소스, 지속적인 인터넷 액세스 및 방대한 양의 데이터를 타사 서버로 전송해야 합니다. 이로 인해 유럽 데이터 보안에 높은 비용, 종속 및 구조적 손실이 발생합니다.

아무도Who는 근본적으로 다른 접근 방식을 취합니다. 해당 엔진을 사용하면 SLM(Small Language Models)을 노트북과 휴대폰에서 로컬로 실행할 수 있으므로 조직과 개인이 데이터를 완벽하게 제어할 수 있습니다. 장치 우선 아키텍처를 사용하면 데이터가 장치 외부로 나갈 필요가 없으므로 설계에 따른 진정한 데이터 주권과 개인 정보 보호가 가능합니다.

Waagner Falkenstrøm은 다음과 같이 설명합니다.

“이러한 모델은 대부분의 표준에 따르면 여전히 크지만 ChatGPT와 같은 시스템보다 훨씬 작습니다. 이전 세대의 대형 모델과 비슷하며 많은 실제 사용 사례에서 그 이상을 수행할 수 있습니다.”

보안 및 개인 정보 보호 이점으로서의 로컬 추론

로컬에서 모델을 실행하면 개인 정보 보호 및 보안에 즉각적인 영향을 미칩니다. 보안 관점에서 볼 때 이는 더욱 탄력적인 아키텍처를 생성합니다.

타겟팅할 수 있는 단일 중앙 집중식 클라우드 서버에 의존하는 대신 계산은 수천, 심지어 수백만 대의 장치에 분산됩니다. 또한 로컬 추론은 클라우드 인프라의 비용 부담을 완전히 덜어줍니다.

사용자는 자신의 하드웨어를 가져오므로 추론 비용을 늘리지 않고도 시스템을 확장할 수 있습니다. 애플리케이션이 사용자 10명이든 천만 명이든 관계없이 클라우드 청구서가 증가하지 않습니다. 이를 통해 NGO, 공공 부문 기관, 초기 단계의 스타트업 등 다른 방법으로는 가격이 책정될 수 있는 조직이 고급 AI에 액세스할 수 있습니다.

AI의 탄소 배출량 500배 감소

NobodyWho의 로컬 우선 SLM 아키텍처는 모델을 축소하고 사용되는 위치 가까이로 이동하여 이러한 공간을 크게 줄입니다.

초기 벤치마크에서는 훈련 공간이 최대 100배 더 적고 추론 공간이 최대 500배 더 적은 것으로 나타났습니다. 따라서 이 접근 방식은 더 저렴하고 빠를 뿐만 아니라 훨씬 더 지속 가능합니다.

기본적으로 오픈 소스

추론 엔진과 추론 라이브러리부터 개발자 통합에 이르기까지,NobodyWho의 핵심은 모두 오픈 소스이며 앞으로도 그럴 것입니다. 아무도 독점 언어 모델을 구축하는 대신 기존 오픈 소스 모델을 실제 제품에서 사용할 수 있도록 만드는 인프라 계층에 중점을 둡니다. 해당 엔진을 사용하면 10,000개 이상의 오픈 소스 언어 모델을 여러 장치와 운영 체제에서 효율적으로 실행할 수 있습니다.

설립자이자 CEO인 Cecilie Waagner Falkenstrøm은 “우리의 믿음은 간단합니다. 모델이 이미 존재한다는 것입니다.”라고 말합니다.

“실제 병목 현상으로 인해 배포가 실용적이게 되었습니다. 특히 기계 학습 전문 지식이 없는 개발자의 경우 더욱 그렇습니다.”

그녀는 대부분의 개발자가 ML 전문가가 아니라고 설명합니다. NothingWho의 목표는 다른 소프트웨어 종속성을 통합하는 것만큼 간단하게 로컬 언어 모델을 실행하는 것입니다.

“앱 개발자는 두 줄의 코드로 로컬 모델을 실행할 수 있어야 합니다.”라고 그녀는 말합니다.

“AI를 출시하기 위해 머신러닝 박사 학위가 필요해서는 안 됩니다.”

이를 달성하기 위해 NothingWho는 주요 개발자 프레임워크와 직접 통합됩니다.

이 회사는 최근 Python 지원을 시작했으며 추가 생태계로 확장하고 있습니다. 이를 통해 개발자는 심층적인 ML 지식이나 사용자 정의 인프라 작업 없이도 누구도 누구를 기존 프로젝트에 투입할 수 없습니다.

이 회사는 개방형 핵심 비즈니스 모델을 기반으로 운영됩니다. 모든 핵심 구성 요소는 오픈 소스로 유지되지만, NothingWho는 미세 조정 서비스로 수익을 창출합니다. 이는 컴퓨팅 요구 사항이 빠르게 비싸지고 팀이 혼자 관리하기에는 운영상 복잡해지는 영역입니다.

Waagner Falkenstrøm은 “회사는 온프레미스에서 모델을 미세 조정할 수 있습니다.”라고 설명합니다.

“하지만 이는 서버, 엔지니어링 시간 및 지속적인 유지 관리를 의미합니다. 대신 그들은 우리 엔진을 사용하여 모델을 미세 조정하고 컴퓨팅 비용을 지불하며 우리는 약간의 비용을 삭감할 수 있습니다. 직접 수행하는 것보다 여전히 훨씬 저렴하고 간단합니다.”

모델이 미세 조정되면 추가 추론 비용 없이 수백만 명의 최종 사용자에게 배포할 수 있습니다. 이는 클라우드가 아닌 로컬에서 모델을 실행하는 것의 주요 이점입니다. 데이터가 있는 곳에서 실행되는 소규모 언어 모델 LLM 대신 SLM을 사용하면 어떤 이점이 있는지 궁금했습니다.

“이전에는 클라우드 기반 모델에 대한 API 호출을 만드는 것이 쉬웠지만 로컬에서 모델을 실행하는 것은 어려웠습니다. “우리는 그 문제를 해결했습니다.”라고 Waagner Falkenstrøm은 말했습니다.

“NobodyWho를 사용하면 지역 추론의 전통적인 복잡성 격차가 효과적으로 제거됩니다.”

매우 광범위하거나 복잡한 추론 작업과 같이 매우 큰 모델이 필요한 일부 사용 사례가 여전히 있습니다. 그 모델은 사라지지 않을 것입니다. 그러나 챗봇, HR 보조원, 고객 지원 및 도메인별 도구와 같은 대부분의 실제 비즈니스 애플리케이션의 경우 특히 미세 조정된 경우 소규모 언어 모델이면 충분합니다. Waagner Falkenstrøm은 “더 작은 모델을 미세 조정하는 것도 더 쉽습니다.”라고 설명했습니다.

“필요한 데이터와 컴퓨팅의 양이 줄어들고 행동을 더 효과적으로 제어할 수 있습니다. 대부분의 회사는 특정 상황에서 운영되며 소규모 모델은 그 분야에서 탁월합니다.”

NobodyWho는 EUPL(European Public License) 1.2를 사용합니다. EUPL은 개인과 회사 모두 해당 코드를 기반으로 상업용 제품을 구축할 수 있도록 명시적으로 허용합니다. 이는 주류 운영 체제 및 개발 프레임워크 전반에 걸친 크로스 플랫폼 지원을 통해 실제 채택을 촉진하기 위한 의도적인 선택입니다.

Waagner Falkenstrøm은 “진정한 활용을 원한다면 상업적 사용이 허용되어야 합니다.”라고 말합니다.

“그렇지 않으면 생태계를 얻을 수 없습니다. 데모를 얻게 됩니다.”

5,000명 이상의 개발자 구축

생태계는 이미 형성되고 있습니다. 현재NobodyWho는 GitHub를 통해 플랫폼을 구축하는 개발자가 5,000명 이상이며, 기여자들이 사용 사례를 논의하고 피드백을 공유하며 로드맵 형성에 도움을 주는 활발한 Discord 커뮤니티와 함께 ​​있습니다.

Waagner Falkenstrøm은 “오픈 소스 측면이 매우 중요합니다.”라고 덧붙입니다. “이것이 바로 사용자뿐만 아니라 기여자도 포함된 실제 커뮤니티가 등장할 수 있게 해주는 것입니다.”

MVP를 훨씬 뛰어넘는 플랫폼을 통해 회사의 초점은 확고하게 규모 확장으로 옮겨졌습니다. “우리는 실험 단계를 지났습니다.”라고 그녀는 말합니다.

“이제는 프레임워크 지원을 확장하고 더 많은 개발자가 프로덕션급 애플리케이션을 구축할 수 있도록 하는 것입니다.”

그녀는 AI의 다음 도약은 모델을 더 작고, 더 지역적이며, 인간 중심적으로 만드는 데서 나올 것이라고 믿습니다.

“AI의 미래는 규모가 아니라 누구나 자신의 장치에서 실행할 수 있는 분산형 모델에 의해 결정될 것입니다.”

투자자들은 특히 개인 정보 보호를 준수하고 클라우드 모델에 대한 비용 효율적인 대안에 대한 수요가 증가함에 따라 에너지 효율적인 로컬 AI의 부상을 유럽의 주요 전략적 기회로 보고 있습니다.

이번 라운드는 PSV Tech, The Footprint Firm, Norrsken Evolve의 지원을 받습니다.

PSV Tech의 공동 창립자이자 총괄 파트너인 Christel Piron은 “저는 거의 10년 동안 Cecilie를 알고 있었으며 그녀가 대담한 아이디어를 실제 작동하는 기술로 일관되게 전환하는 방법을 직접 보았습니다.”라고 말합니다.

“NobodyWho를 지원하는 것은 우리에게 당연한 일이었습니다. 이 팀은 개인 정보를 보호하고 에너지 효율적이며 어디에서나 개발자와 회사가 액세스할 수 있는 중요한 유럽 AI 인프라를 구축하는 뛰어난 팀입니다.”

The Footprint Firm의 CIO인 Sofie Käll은 다음과 같이 말했습니다.

“NobodyWho는 개발자를 위한 이러한 초효율 모델을 진정한 플러그 앤 플레이로 만드는 인프라를 개척하고 있습니다.

이는 가장 빠르게 성장하는 배출 범주 중 하나에서 혁신적인 기후 기술 기회이며, 우리는 업계를 보다 책임감 있는 AI로 전환할 수 있는 팀을 지원하게 되어 기쁘게 생각합니다.”

Waagner Falkenstrøm은 우리가 무엇을 하든 “더 큰 것이 더 낫다”는 게임에서 유럽이 미국이나 중국을 능가하지 못할 것이라고 주장합니다.

“컴퓨팅, 자본, 하이퍼스케일 인프라는 비교할 수 없습니다.

“그러나 우리의 경험을 통해 우리는 소형 모델이 여러 분야에서 진정으로 강력하다는 것을 알았습니다. 이는 유럽이 다르게 경쟁할 수 있는 기회를 창출합니다.”

동시에, NothingWho가 하는 일에는 강력한 가치 기반 차원이 있습니다. 그녀는 다음과 같이 주장합니다.

“EU와 북유럽 출신인 우리는 데이터 보안, GDPR 준수, 지속 가능성 및 데이터 주권에 깊은 관심을 갖고 있습니다. 누구도 이러한 가치를 반영하도록 설계되었습니다.”

“기술이 힘이다”

Waagner Falkenstrøm은 유럽이 스스로를 믿어야 한다고 주장합니다. 우리는 세계 최고의 교육 시스템, 소프트웨어 엔지니어 및 연구 기관을 보유하고 있습니다.

“우리는 미국을 따라할 필요가 없습니다. 유럽의 강점과 가치를 반영하는 AI를 구축해야 합니다. 또한 기술은 힘입니다.

우리가 개인 정보 보호, 주권, 지속 가능성 및 민주적 통제에 관심을 갖고 있다면 이러한 가치가 기술 자체에 내재되어 있어야 합니다. 이것이 바로 우리가NobodyWho를 통해 하려고 하는 일입니다. 누구나 구축할 수 있는 분산형, 개방형, 개인정보 보호 AI입니다.”

Waagner Falkenstrøm은NobodyWho를 특히 소규모 언어 모델을 위한 인프라를 구축하는 회사의 첫 번째 실제 물결의 일부로 보고 있습니다.

“1년 전에는 SLM이 널리 논의되지 않았습니다. 오늘날 개발자와 투자자는 이 범주를 이해하고 있습니다. 모델은 빠르게 개선되고 도구는 성숙해졌습니다.

거대 기술 기업이 이 분야에 진출하겠지만 자체 생태계에 맞게 최적화할 것입니다. Apple은 Apple을 위해 구축할 것입니다. Microsoft는 Microsoft를 위해 구축할 것입니다. 우리는 플랫폼에 구애받지 않습니다. 이는 의미 있는 기회를 창출합니다.”

출처 참조

Post Comment

당신은 놓쳤을 수도 있습니다