9월 30, 2025Published by Sean Kim on 9월 30, 2025Categories AI 도구 & 서비스Claude Sonnet 4.5 출시: SWE-bench 77.2% 달성과 30시간 자율 에이전트 — 무엇이 달라졌나Anthropic이 Claude Sonnet 4.5를 공개했습니다. SWE-bench Verified 77.2%, OSWorld 61.4%, 그리고 30시간 이상 집중력을 유지하는 자율 에이전트까지. 전작과 동일한 $3/$15 토큰 가격에 이 정도 성능 도약이라면, […]
9월 2, 2025Published by Sean Kim on 9월 2, 2025Categories AI 도구 & 서비스Claude Sonnet 4.5 벤치마크 심층 분석: SWE-bench 77.2%로 GPT-5를 넘었다SWE-bench 77.2%. 이 숫자 하나가 2025년 AI 코딩 모델 시장의 판도를 완전히 뒤집었습니다. Anthropic이 내놓은 Claude Sonnet 4.5 벤치마크 결과는 단순한 업그레이드가 아니라, 미드티어 모델이 플래그십을 […]
9월 1, 2025Published by Sean Kim on 9월 1, 2025Categories AI 도구 & 서비스Claude Sonnet 4.5 출시: SWE-Bench 77.2%, 30시간 자율 코딩 — 개발자들이 갈아타는 이유Anthropic이 AI 코딩 전쟁의 가장 강력한 무기를 꺼내 들었습니다 — 그리고 가격은 이전 모델과 정확히 동일합니다. 2025년 9월 29일 출시된 Claude Sonnet 4.5는 SWE-bench Verified에서 77.2%를 […]