8월 7, 2025Published by Sean Kim on 8월 7, 2025Categories AI 도구 & 서비스GPT-5 SWE-Bench Coding Performance 74.9% 달성 — 그런데 실전 평가는 7.46점?SWE-Bench 74.9%, Aider Polyglot 88%, 멀티파일 리팩토링 91%. 오늘 출시된 GPT-5의 코딩 벤치마크 숫자만 보면, OpenAI가 드디어 AI 코딩의 새 시대를 열어젖힌 것 같습니다. 그런데 독립 […]