10월 29, 2025

M4 Max AI 추론 벤치마크: Llama 70B 20 tok/s, 로컬 AI의 새로운 기준을 세우다

700억 파라미터 언어 모델을 노트북에서 초당 20토큰으로 돌린다 — 클라우드 없이, GPU 서버랙 없이, 천만 원짜리 NVIDIA 카드 없이. M4 Max 맥북 프로가 실제 벤치마크에서 보여준 […]
6월 4, 2025

WWDC 2025 Core ML에 MLTensor 추가, Foundation Models 프레임워크로 3B 온디바이스 LLM 무료 제공 — 개발자가 알아야 할 모든 것

Swift 코드 3줄. Apple의 30억 파라미터 언어 모델을 온디바이스로 돌리는 데 필요한 전부입니다. API 키도, 클라우드 비용도, 인터넷 연결도 필요 없습니다. WWDC 2025 Core ML 발표는 […]