10월 29, 2025Published by Sean Kim on 10월 29, 2025Categories 테크 & 하드웨어M4 Max AI 추론 벤치마크: Llama 70B 20 tok/s, 로컬 AI의 새로운 기준을 세우다700억 파라미터 언어 모델을 노트북에서 초당 20토큰으로 돌린다 — 클라우드 없이, GPU 서버랙 없이, 천만 원짜리 NVIDIA 카드 없이. M4 Max 맥북 프로가 실제 벤치마크에서 보여준 […]