Openai 런칭, Chatgpt의 범용 대리인

Openai 런칭, Chatgpt의 범용 대리인

OpenAi는 Chatgpt에서 새로운 범용 AI 에이전트를 출시하고 있으며, 회사는 사용자를 대신하여 다양한 컴퓨터 기반 작업을 완료 할 수 있다고 말합니다. OpenAi는 에이전트가 사용자의 캘린더를 자동으로 탐색하고 편집 가능한 프리젠 테이션 및 슬라이드 쇼를 생성하며 코드를 실행할 수 있다고 말합니다.

Chatgpt 에이전트라고하는이 도구는 OpenAI의 이전 에이전트 도구의 여러 기능을 결합합니다. 운영자의 웹 사이트를 클릭하는 능력과 수십 개의 웹 사이트에서 간결한 연구 보고서로 정보를 종합하는 Deep Research의 능력을 포함 하여이 도구가 결합됩니다. Openai는 사용자가 Chatgpt에게 자연 언어로 송금하여 에이전트와 상호 작용할 수있을 것이라고 말했다.

Chatgpt 에이전트는 목요일에 Openai의 Pro 및 팀 계획 가입자에게 출시됩니다. 도구를 활성화하기 위해 사용자는 Chatgpt의 드롭 다운 도구 메뉴에서 “에이전트 모드”를 선택할 수 있습니다.

Chatgpt 에이전트의 출시는 OpenAi의 가장 대담한 시도를하지만 Chatgpt를 질문에 대답하는 대신 사용자에게 작업 및 오프로드 작업을 수행 할 수있는 에이전트 제품으로 전환하려는 시도를 나타냅니다. 최근 몇 년 동안 Openai, Google 및 Perplexity를 포함한 Silicon Valley Company는 그 일을 약속 한 수십 명의 AI 요원을 공개했습니다. 그러나 이러한 초기 버전 AI 에이전트는 복잡한 작업으로 어려움을 겪고있는 것으로 입증되었으며 AI 에이전트 주변의 궁극적 비전 기술 경영진보다 제품으로 덜 설득력있는 것처럼 보입니다.

즉, Openai는 Chatgpt 에이전트가 이전 제품보다 훨씬 능력이 있다고 말합니다.

회사의 새로운 에이전트는 Chatgpt 커넥터에 액세스 할 수 있으므로 사용자가 Gmail 및 Github와 같은 앱을 연결하여 에이전트가 프롬프트에 관련 정보를 찾을 수 있습니다. Openai는 Chatgpt 에이전트가 터미널에 액세스 할 수 있으며 API를 사용하여 특정 앱에 액세스 할 수 있다고 말합니다.

OpenAi는 사용자가 ChatGpt 에이전트를 탭하여“4 개로 일본식 아침 식사를 만들기 위해 재료를 계획하고 구매하고 3 명의 경쟁사를 분석하고 슬라이드 데크를 만듭니다”라고 제안합니다. 이러한 종류의 기능을 사용하려면 Chatgpt 에이전트가 웹 사이트를 구문 분석하고, 행동 과정을 계획하며, 도구를 사용해야합니다. OpenAI가 이전에 에이전트와 해결하려고 시도한 것보다 훨씬 더 복잡한 작업.

TechCrunch 이벤트

샌프란시스코
|
2025 년 10 월 27-29 일

OpenAI에 따르면 ChatGpt 에이전트가 여러 벤치 마크에서 최첨단 성능을 제공합니다.

이 회사는 Chatgpt 에이전트 모델이 인류의 마지막 시험 (Pass@1)에서 41.6%를 기록했으며, 이는 100 명 이상의 과목에서 수천 개의 질문으로 구성된 어려운 테스트입니다. 그것은 OpenAi의 O3 및 O4-Mini가 테스트에서 득점 한 내용 대략 두 배입니다.

가장 어려운 수학 벤치 마크 중 하나 인 Frontiermath에서 Openai는 Chatgpt 에이전트가 코드 실행을위한 터미널과 같은 도구에 액세스 할 때 27.4%의 점수를 받았다고 말합니다. 이전 최신 점수는 O4-Mini에서 비롯된 것으로 6.3%만 기록했습니다.

Openai는 안전을 염두에두고 Chatgpt 에이전트를 개발했다고 지적했다.이 제품은 나쁜 행위자의 손에 더 위험 할 수있는 새로운 기능을 제공하기 때문이다. Openai는 이전에 에이전트 모델이 더 위험한 기능을 제시 할 수 있다고 경고했습니다.

ChatGpt 에이전트의 안전 보고서에서 OpenAi는이 모델을 생물학적 및 화학 무기 영역에서 “높은 기능”으로 지정했으며, 이는 OpenAI의 준비 프레임 워크에서 “기존 경로를 심각한 피해로 증폭시키는 능력”으로 정의된다고 밝혔다. Openai는 이에 대한 직접적인 증거가 없지만 예방 접근 방식을 취하고 이러한 위험을 완화하기 위해 새로운 보호 조치를 활성화하기로 결정했습니다.

ChatGpt 에이전트의 새로운 보호 장치에는 사용자가 제품과 상호 작용할 때 실시간으로 작동하는 모니터가 포함되어 있습니다. OpenAi는 Chatgpt 에이전트에 입력 한 모든 프롬프트에서 분류기를 실행하여 요청이 생물학과 관련이 있는지 여부를 결정한다고 밝혔다. 그렇다면 OpenAI는 콘텐츠가 생물학적 위협을 불러 일으키는 데 사용될 수 있는지 여부를 결정하는 두 번째 모니터를 통해 ChatGPT 에이전트의 응답을 실행합니다.

OpenAi는 또한이 에이전트가 오용을 방지하기 위해 ChatGpt의 메모리 기능을 비활성화했다고 밝혔다. Chatgpt의 다른 부분에서 OpenAi의 메모리 기능을 사용하면 챗봇이 이전 사용자 채팅의 정보를 참조 할 수 있습니다. 그러나 OpenAi는 나쁜 행위자가 Chatgpt 에이전트의 기능을 사용하여 신속한 주입 공격을 통해 민감한 데이터를 추방 할 수 있다고 말합니다. 그러나 회사는 향후 기능을 추가 할 수 있다고 밝혔다.

Chatgpt 에이전트는 인상적으로 들리지만 실제 세계에서 얼마나 유능한 지 볼 수 있습니다. 지금까지 에이전트 기술은 실제 세계와 상호 작용할 때 비교적 취성으로 입증되었습니다. 즉, OpenAi는 AI 요원의 약속을 전달할 수있는보다 유능한 모델을 개발했다고 밝혔다.

이 이야기는 자세한 정보로 업데이트되었습니다.

출처 참조

Post Comment

당신은 놓쳤을 수도 있습니다