콜드 스타트 67초. 프로덕션에서 torch.compile을 도입하려던 팀이라면 이 숫자가 얼마나 고통스러운지 아실 겁니다. PyTorch 2.5가 이 문제를 9.6초로 끌어내렸습니다—무려 7배 단축입니다. 여기에 FlexAttention이라는 완전히 새로운 어텐션 […]
오픈소스 모델 6개를 합치니 GPT-4o를 넘었습니다. AlpacaEval 2.0에서 65.1% — GPT-4o의 57.5%를 7.6%p 차이로 제쳤습니다. Together AI의 Mixture of Agents(MoA)가 증명한 숫자입니다. 그리고 2025년 9월, Together […]