성능, 액세스 방법 등

성능, 액세스 방법 등

대기가 끝났습니다! Anthropic의 Claude 3.7 Sonnet이 여기에 있습니다-2025 년의 첫 번째 주요 릴리스. 이것은 마지막 업데이트 인 Sonnet 3.5 모델 (코딩 강국)을 따릅니다. API 사용자는 모델의 사고 기간을 정확하게 제어하여 자신의 요구에 맞게 조정됩니다. Claude 3.7 Sonnet은 코딩 및 프론트 엔드 웹 개발이 크게 향상되었습니다. 성능을 확인하고 액세스하는 방법을 확인하고 시도해 봅시다!

프론티어 추론은 실용적이었습니다

Claude 3.7 Sonnet은 단일 모델에 빠른 응답과 깊은 반사를 통합하여 추론에 대한 통일 된 접근 방식을 반영합니다. 그것은 표준 LLM과 추론 모델로 기능하며 Claude 3.5 Sonnet을 업그레이드하는 표준 모드와 수학, 물리, 코딩 등의 성능을 향상시키는 확장 된 사고 모드를 업그레이드합니다.

https://www.youtube.com/watch?v=T3NNDXA81HS

API 사용자는 사고, 균형 속도 및 품질을위한 토큰 예산을 설정할 수 있습니다. 경쟁 업체와 달리 Sonnet 3.7은 경쟁 문제보다 실제 작업 우선 순위를 정해 비즈니스 사용을 최적화했습니다.

Claude Sonnet 3.7 성능

초기 테스트에 따르면 Claude는 Cursor, Cognition, Vercel, REPLIT 및 CANVA를 통해 복잡한 코드베이스, 전체 스택 업데이트, 에이전트 워크 플로우 및 더 적은 오류와 더 나은 디자인으로 제작 준비 코드를보고하는 Claude가 코딩에서 뛰어납니다.

출처 : 의인성

AI 모델의 실제 소프트웨어 문제를 해결하는 벤치 마크 테스트 인 SWE-Bench Verified에서 최고 수준의 성능을 제공합니다. 스캐 폴딩에 대한 자세한 내용은 부록을 참조하십시오.

출처 : 의인성

사용자 및 도구 상호 작용과 관련된 복잡한 실제 작업에서 AI 에이전트를 평가하는 프레임 워크 인 Tau-Bench에 탁월합니다. 발판 세부 사항은 부록에서 확인하십시오.

Claude 3.7 Sonnet은 수학 및 과학 성능을 크게 향상시키는 확장 된 사고와 함께 명령을 따르는, 일반 추론, 멀티 모달 기능 및 에이전트 코딩에 탁월합니다. 표준 벤치 마크 외에도 Pokémon 게임 플레이 테스트에서 모든 이전 모델을 능가했습니다.

Claude Sonnet 3.7에 액세스하는 방법?

Chatbot 및 API 로이 모델에 액세스 할 수 있습니다. 두 가지 접근법을 모두 살펴 보겠습니다.

챗봇을 통해 Sonnet 3.7 사용

1. Claude.ai로 이동하여 Gmail 계정 또는 Github를 사용하여 가입하십시오.

2. 올바른 모델을 선택하고 대화를 시작하십시오!

API를 통해 Sonnet 3.7에 액세스하십시오

가입하고 API 키를 얻으십시오:

  • Anthropic 웹 사이트 (Anthropic.com)를 방문하여 계정에 가입하십시오.
  • 계정 대시 보드의 API 섹션으로 이동하여 API 키를 생성하십시오. 이 키는 귀하의 요청을 인증합니다.

의인성 파이썬 라이브러리를 설치하십시오:

API와 상호 작용하려면 의인성 파이썬 패키지가 필요합니다. PIP를 사용하여 설치하십시오.

pip install anthropic

환경 설정 :

스크립트에서 하드 코딩을 피하기 위해 API 키를 환경 변수로 단단히 저장하십시오. 예를 들어:

export ANTHROPIC_API_KEY='your-api-key-here'

Claude 3.7 Sonnet API의 샘플 파이썬 코드

Claude 3.7 Sonnet 모델을 사용하기위한 간단한 예는 다음과 같습니다.

import anthropic
import os

# Initialize the Anthropic client with your API key
client = anthropic.Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

# Send a message to Claude 3.7 Sonnet
response = client.messages.create(
    model="claude-3-7-sonnet-20250225",  # Model name for Claude 3.7 Sonnet
    max_tokens=1000,  # Maximum output tokens (adjust as needed)
    messages=[
        {
            "role": "user",
            "content": "Hello! Can you tell me about the weather today?"
        }
    ]
)

# Print the response
print(response.content[0].text)

시도해 봅시다!

즉각적인:이 체스 판 위치를 분석하십시오. 현재 플레이어 (흰색)가 블랙을 확인하고 추론을 설명하기위한 최선의 움직임을 제안하십시오.

체스 보드

Claude Sonnet 3.7 출력 :

Grok, Deepseek, O3-Mini 및 O1 출력 :

관찰:

Grok 3, DeepSeek R1, OpenAi의 O1 및 O3-Mini 로이 이미지 분석 작업을 테스트했으며 그 중 하나는 정답을 제공하지 못했습니다. 나는 Claude 3.7 Sonnet이 신속하게 응답했을뿐만 아니라 응답을 못 박았다는 사실에 놀랐습니다!

다른 사용자의 예

끝 참고

Claude 3.7 Sonnet의 도착은 하이브리드 추론을 최전선에 가져와 깊고 눈에 띄는 문제 해결과 빠른 응답을 병합합니다. 코딩, 실제 작업 및 Pokémon Gameplay와 같은 틈새 테스트의 우수성은이를 강력한 경쟁자로 자리 매김합니다.

다음으로, 우리는 분석 Vidhya 블로그의 자세한 기사를 통해 한계를 탐색하여 현재 추론 리더에 대해 도전합니다 : Deepseek R1, Grok 3, Openai ‘s O1 및 O3-Mini. 경쟁 업체가 우연히 발견 된 스팟 온 체스 보드 분석과 같은 초기 결과는이를 능가 할 수 있다고 제안합니다. API 유연성과 실용적인 우위를 통해 경쟁을 방해하기 위해 여기에 있습니다.

니티카 샤르마

안녕하세요, 저는 기술에 정통한 컨텐츠 제작자이자 마케팅 담당자 인 Nitika입니다. 창의성과 새로운 것을 배우는 것은 자연스럽게 나에게 온다. 결과 중심의 콘텐츠 전략을 만드는 데 전문 지식이 있습니다. 저는 SEO 관리, 키워드 작업, 웹 컨텐츠 작성, 커뮤니케이션, 콘텐츠 전략, 편집 및 쓰기에 정통합니다.

출처 참조

Post Comment

당신은 놓쳤을 수도 있습니다