이틀. AI 판도가 완전히 뒤집히는 데 걸린 시간입니다. 8월 5일 Anthropic이 Claude Opus 4.1을 공개했고, 이틀 뒤인 8월 7일 OpenAI가...
8월 11, 2025
3일 전, Anthropic이 플래그십 모델의 칼날을 한 번 더 갈았습니다. Claude Opus 4.1 — SWE-bench Verified 74.5%, 확장 사고 64K...
8월 8, 2025
SWE-Bench 74.9%, Aider Polyglot 88%, 멀티파일 리팩토링 91%. 오늘 출시된 GPT-5의 코딩 벤치마크 숫자만 보면, OpenAI가 드디어 AI 코딩의 새...
8월 7, 2025
드디어 GPT-5가 나왔습니다. 그리고 GPT-5 vs Claude 3.5 Sonnet vs Gemini 2.5 Pro — 이 세 모델의 벤치마크 격차가 역대...
8월 6, 2025
무료 사용자가 ‘사고’할 수 있게 되었습니다. 단순한 채팅이 아니라, 진짜 추론입니다. 2025년 8월 7일, OpenAI가 GPT-5를 공개하면서 역사상 처음으로 무료...
8월 5, 2025
94.6%. AIME 2025 수학 벤치마크에서 GPT-5가 기록한 점수입니다. GPT-4o 대비 팩트 오류는 45% 감소, o3 사고 모드 대비로는 80%나 줄었습니다....
8월 4, 2025
ElevenLabs가 AI 음악 시장에 폭탄을 던졌습니다. 2025년 8월 5일, 이 보이스 AI 거인이 Eleven Music을 출시했습니다 — Merlin Network와 Kobalt...
8월 4, 2025
OpenAI GPT-5가 공식 출시를 목전에 두고 있습니다. 7월 24일 Axios의 단독 보도로 수면 위에 올라온 이 모델은, 단순한 버전 업그레이드가...
8월 1, 2025
2025년 8월 5일, ElevenLabs Eleven Music이 출시되면서 AI 음악 생성 시장의 판도가 바뀌었습니다. Suno와 Udio가 RIAA 저작권 소송에 시달리는 동안,...
8월 1, 2025
2025년 7월 10일, xAI가 AI 업계에 폭탄을 투하했습니다. Grok 4가 벤치마크를 단순히 넘은 게 아니라 박살냈습니다. AIME 2025(수학 올림피아드)에서 만점....
7월 31, 2025
질문에 대해 추론하는 동시에 X의 실시간 포스트, 웹 뉴스, 트렌딩 데이터를 끌어와서 답변하는 AI — 더 이상 컨퍼런스 발표 슬라이드가...
7월 30, 2025
“이 AI 영상, 광고에 써도 되나요?” Runway Gen-3 Alpha 상업 라이선스 문제는 2025년 AI 영상 제작을 도입하려는 브랜드와 에이전시가 가장...
7월 25, 2025