Openai와 Google은 Mathletes를 야외로하지만 서로는 아닙니다.
Openai와 Google Deepmind의 AI 모델은 세계에서 가장 오래되고 가장 어려운 고등학교 수준의 수학 대회 중 하나 인 2025 International Math Olympiad (IMO)에서 골드 메달 점수를 얻었으며 최근에 독립적으로 발표했습니다.
결과는 AI 시스템이 얼마나 빨리 발전하고 있는지를 강조했지만 Google과 Openai가 AI 레이스에 얼마나 균등하게 일치하는지에 대해서는 강조합니다. AI 기업들은 AI 레이스에서 앞서 나가는 대중의 인식에 대해 치열하게 경쟁하고 있습니다. 최고 AI 인재를 확보하는 데 큰 영향을 줄 수있는“Vibes”의 무형의 전투. 많은 AI 연구자들은 경쟁적인 수학의 배경에서 나 왔으므로 IMO와 같은 벤치 마크는 다른 사람들보다 더 의미가 있습니다.
작년에 Google은 “공식적인”시스템을 사용하여 IMO에서 은메달을 득점했습니다. 즉, 인간은 문제를 기계 읽을 수있는 형식으로 변환해야했습니다. 올해 OpenAI와 Google은 경쟁에“비공식”시스템을 입력하여 질문을 수집하고 자연 언어로 증명 기반 답변을 생성 할 수있었습니다. 두 회사 모두 AI 모델이 IMO 테스트에서 6 개의 질문 중 5 개 질문에 올바르게 답변했으며, 작년부터 대부분의 고등학생과 Google의 AI 모델보다 높은 점수를 얻었으며, 인간-기계 번역은 필요하지 않습니다.
TechCrunch와의 인터뷰에서 OpenAI와 Google의 IMO 노력의 연구원들은 이러한 금메달 공연이 비 투명 불가능한 영역에서 AI 추론 모델에 대한 돌파구를 나타냅니다. AI 추론 모델은 간단한 수학 또는 코딩 작업과 같은 간단한 답변으로 질문에 잘 어울리는 경향이 있지만, 이러한 시스템은 훌륭한 의자 구매 또는 복잡한 연구를 돕는 것과 같은보다 모호한 솔루션으로 작업에 어려움을 겪고 있습니다.
그러나 Google은 OpenAi가 어떻게 수행하고 금메달 IMO 성능을 발표했는지에 대한 의문을 제기하고 있습니다. 결국, 고등학생을위한 수학 대회에 AI 모델을 입력하려면 십대처럼 주장 할 수도 있습니다.
OpenAi가 토요일 아침에 업적을 발표 한 직후, Google DeepMind의 CEO와 연구자들은 금메달을 조기에 발표 한 직후에 금메달을 미리 발표 한 후 Openai를 Slam Openai로 가져갔습니다. 금요일 밤 고등학교가 어느 경쟁에서 우승했는지, 그리고 모델의 테스트를 공식적으로 평가하지 않은 것에 대해 IMO가 공식적으로 평가하지 않았습니다.
Google Deepmind의 선임 연구원이자 IMO 프로젝트의 리더 인 Thang Luong은 TechCrunch에 Google이 경쟁에 참여하는 학생들을 존중하기 위해 IMO 결과를 발표하기를 기다렸다 고 말했다.
TechCrunch 이벤트
샌프란시스코
|
2025 년 10 월 27-29 일
Luong은 Google이 작년부터 시험 준비를 위해 IMO의 주최자와 협력 해 왔으며 월요일 아침에 공식 결과를 발표하기 전에 IMO 대통령의 축복과 공식 채점을 원한다고 말했다.
Luong은“IMO 주최측은 등급 지침을 가지고 있습니다. “따라서이 가이드 라인을 기반으로하지 않는 평가는 금메달 수준에 대한 주장을 할 수 없습니다. [performance].”
IMO 모델에서 일한 수석 OpenAi 연구원 인 Noam Brown은 TechCrunch에 IMO가 몇 달 전에 공식 수학 경쟁에 참여하는 것에 대해 OpenAI에 연락했다고 말했다. Brown은 Openai는 IMO가 Google과 비공식 테스트를 수행하고 있다는 것을 몰랐다고 말합니다.
Openai는 AI 모델의 성능을 평가하기 위해 3 자 평가자 (채점 시스템을 이해 한 3 명의 이전 IMO 메달리스트)를 고용했다고 밝혔다. Openai는 금메달 점수를 알게 된 후 회사가 IMO에 연락했다고 말했다. 그리고 나서 회사는 IMO의 금요일 밤 시상식 이후까지 발표되기를 기다렸다 고 말했다.
IMO는 TechCrunch의 의견 요청에 응답하지 않았습니다.
Google은 반드시 잘못된 것은 아닙니다. 금메달 점수를 달성하기 위해보다 공식적이고 엄격한 프로세스를 거쳤지만 토론은 더 큰 그림을 놓칠 수 있습니다. 여러 주요 AI 실험실의 AI 모델이 빠르게 향상되고 있습니다. 전 세계의 국가들이 올해 IMO에서 가장 밝은 학생들을 보냈으며, 그 중 몇 %만이 Openai 및 Google의 AI 모델을 득점했습니다.
Openai는 업계에서 중요한 주도권을 가졌지 만, 어떤 회사가 인정하고자하는 것보다 레이스가 더 밀접하게 일치하는 것처럼 느껴집니다. OpenAi는 앞으로 몇 달 안에 GPT-5를 출시 할 것으로 예상되며, 회사는 여전히 AI 산업을 이끌고 있다는 인상을주기를 희망합니다.
Post Comment