5월 27, 2025Published by Sean Kim on 5월 27, 2025Categories 산업 뉴스Groq LPU 추론, 초당 500 토큰 돌파: NVIDIA GPU 독점에 도전하는 추론 전용 칩의 부상초당 625 토큰. 오타가 아닙니다. 이름 없는 연구실의 합성 벤치마크도 아닙니다. Meta의 Llama 모델을 프로덕션 환경에서 돌리는 Groq LPU 추론 엔진의 실제 수치입니다. NVIDIA의 최신 H100 […]