large-language-model - Sean Kim

11월 10, 2025

Published by Sean Kim on 11월 10, 2025

Categories

환각률 12%에서 4.22%로. 숫자만 보면 단순한 개선 같지만, 이 차이는 AI를 실무에 쓸 수 있느냐 없느냐를 가르는 경계선입니다. 2025년 11월 17일, xAI가 공개한 Grok 4.1은 단순 […]

8월 4, 2025

Published by Sean Kim on 8월 4, 2025

Categories

94.6%. AIME 2025 수학 벤치마크에서 GPT-5가 기록한 점수입니다. GPT-4o 대비 팩트 오류는 45% 감소, o3 사고 모드 대비로는 80%나 줄었습니다. 숫자만 보면 압도적이지만, 진짜 혁신은 다른 […]

6월 12, 2025

Published by Sean Kim on 6월 12, 2025

Categories

드디어 오픈소스 AI가 폐쇄형 모델과 정면 승부를 벌일 수 있게 됐습니다. 2024년 7월 23일, Meta가 공개한 Llama 3.1 405B는 4050억 개의 파라미터를 가진 역대 최대 규모의 […]

5월 28, 2025

Published by Sean Kim on 5월 28, 2025

Categories

132B 파라미터 모델이 36B만 켜고도 70B 모델을 이긴다면 믿으시겠습니까? Databricks DBRX가 정확히 그 일을 해냈습니다. 2024년 3월 출시 이후 1년이 지난 지금, 이 모델이 엔터프라이즈 AI […]

5월 28, 2025

Published by Sean Kim on 5월 28, 2025

Categories

132B 파라미터 모델이 36B만 켜고도 70B 모델을 이긴다면 믿으시겠습니까? Databricks DBRX가 정확히 그 일을 해냈습니다. 2024년 3월 출시 이후 1년이 지난 지금, 이 모델이 엔터프라이즈 AI […]