500,000개의 Trainium2 칩이 하나의 슈퍼컴퓨터로 연결됐습니다. 프로젝트 레이니어(Project Rainier)가 11월 초 공식 가동을 시작하면서, AWS는 12월 1일 개막하는 re:Invent 2025를 향해 엄청난 신호탄을 쏘아 올렸습니다. AWS […]
콜드 스타트 67초. 프로덕션에서 torch.compile을 도입하려던 팀이라면 이 숫자가 얼마나 고통스러운지 아실 겁니다. PyTorch 2.5가 이 문제를 9.6초로 끌어내렸습니다—무려 7배 단축입니다. 여기에 FlexAttention이라는 완전히 새로운 어텐션 […]