11월 10, 2025

xAI Grok 4.1 — 환각률 65% 감소, LM Arena 1위 달성한 진짜 실력

환각률 12%에서 4.22%로. 숫자만 보면 단순한 개선 같지만, 이 차이는 AI를 실무에 쓸 수 있느냐 없느냐를 가르는 경계선입니다. 2025년 11월 17일, xAI가 공개한 Grok 4.1은 단순 […]
8월 4, 2025

GPT-5 심층 분석: OpenAI가 만든 최초의 통합 모델, 속도·추론·멀티모달 완전 해부

94.6%. AIME 2025 수학 벤치마크에서 GPT-5가 기록한 점수입니다. GPT-4o 대비 팩트 오류는 45% 감소, o3 사고 모드 대비로는 80%나 줄었습니다. 숫자만 보면 압도적이지만, 진짜 혁신은 다른 […]
6월 12, 2025

Meta Llama 3.1 405B: GPT-4o에 필적하는 역대 최대 오픈소스 AI 모델이 바꿀 것들

드디어 오픈소스 AI가 폐쇄형 모델과 정면 승부를 벌일 수 있게 됐습니다. 2024년 7월 23일, Meta가 공개한 Llama 3.1 405B는 4050억 개의 파라미터를 가진 역대 최대 규모의 […]
5월 28, 2025

Databricks DBRX: 36B 활성 파라미터로 70B 모델을 압도한 132B MoE의 진짜 실력

132B 파라미터 모델이 36B만 켜고도 70B 모델을 이긴다면 믿으시겠습니까? Databricks DBRX가 정확히 그 일을 해냈습니다. 2024년 3월 출시 이후 1년이 지난 지금, 이 모델이 엔터프라이즈 AI […]
5월 28, 2025

Databricks DBRX: 36B 활성 파라미터로 70B 모델을 압도한 132B MoE의 진짜 실력

132B 파라미터 모델이 36B만 켜고도 70B 모델을 이긴다면 믿으시겠습니까? Databricks DBRX가 정확히 그 일을 해냈습니다. 2024년 3월 출시 이후 1년이 지난 지금, 이 모델이 엔터프라이즈 AI […]