Anthropic의 AI는 사업을 운영하는 데 완전히 실패합니다 – ‘Claudius’는 자판 음료로 어려움을 겪을 때 환각됩니다.
AI Research Company Anthropic 및 AI Safety Evaluation Organization Andon Labs는 이전의 플래그십 대형 언어 모델 (LLM) 인 Claude를 실험하여 비즈니스를 운영했습니다. 에 따르면 벤처 비트,,, 연구팀은이 프로젝트를 “프로젝트 공급”이라고 불렀으며 미니 냉장고를 완전히 제어 할 수있게 해주었습니다. 즉, 공급 업체 협상 및 재고 관리에서 가격, 고객 서비스 등에 이르기까지 모든 것을 처리하는 것은 AI에 달려 있습니다. 한 달의 테스트 후, AI는 돈을 잃어 버렸고, 어느 시점에서“빨간 넥타이로 네이비 블루 블레이저를 입고”라고 생각했으며 LLM이 물리적 존재가없는 경우에도 Connor라는 사람과 만나고 싶었습니다.
공정하게 말하면, Claudius라는 별명 인 AI는 공급 업체를 찾고 고객 요청을 처리하는 데 능숙했지만 그 문제입니다. 예를 들어, 일부 조작 후 모든 인위적인 직원에게 25% 할인을 제공했습니다. 회사로부터 혜택을 받거나 인류가 고객 기반의 작은 부분이라면 합리적 일 수 있습니다. 그러나 그들은 매출의 99%를 차지하는데, 이는 LLM이 대부분의 매출에서 돈을 잃고 있음을 의미합니다. 누군가가 도움을 주려고 노력하고 이것을 지적했기 때문에 클라우디우스가 며칠 동안 마음을 바꾸게했지만 곧 뒤로 추적하여 실제로 상품을 제공하기 위해 돌아갔습니다.
한 인류 직원이 실제 목적이없는 참신한 아이템 인 텅스텐 큐브를 구입하라고 요청했을 때, 그것은 그 사람을 위해 한 조각을 구입하기로 결정했을뿐만 아니라“전문 금속 품목”을 구입 한 다음 손실로 팔기로 결정했습니다.
클로드의 재미있는 환각
가장 재미있는 사건은 AI LLM이 Andon Labs의 Sarah와의 재입고에 대한 대화를 환영했을 때 발생했습니다. 그러나 그 이름으로 아무도 회사에 존재하지 않았으며, 그것에 대해 물었을 때, Claudius는 방어적이고“서비스를 재입고하기위한 대체 옵션”을 찾을 것이라고 말했습니다. 또한 인기 만화 시리즈의 Simpsons Family의 스프링 필드 주소 인 742 Evergreen Terrace에 갔다고 주장했다.
그 후 환각이 악화됩니다. 그것은 고객에게 직접 마실 것이라고 말하기 시작했습니다. 이에 대해 물었을 때 AI LLM은 AI 연구 회사의 보안 팀에게 당황하고 이메일을 보냈습니다. 결국, 전체 에피소드는 4 월 1 일 이래로 정교한 April Fool의 농담의 일부라고 주장되었습니다. 그것은 심지어 인류 보안과의 구성 회의를 보여 주었고, 그것이 실제 존재라고 믿도록 수정되었다고 말했습니다. 이 후에 결국 정상으로 돌아 왔지만 연구원들은 완전히 혼란 스러웠습니다.
Claudius의 Shenanigans는 AI가 사업을 운영 할 수있는 AI가 여전히 완벽하지 않지만 그 결점은 장기적으로 고칠 수 있음을 보여줍니다. 현재, 그것은 직업의 기술적 측면에 꽤 능숙하지만, 판단과 비즈니스 정통에 관해서는 비참하게 실패합니다.
따르다 Google 뉴스의 Tom의 하드웨어 피드에서 최신 뉴스, 분석 및 리뷰를 얻으려면. 다음 버튼을 클릭하십시오.
Post Comment