
Valhalla Supermassive 3.0 업데이트: 무료 리버브 플러그인의 Leo, Virgo 모드가 게임체인저인 이유
5월 12, 2025
Model Context Protocol: OpenAI까지 채택한 AI 도구 통합의 USB-C 표준
5월 13, 2025노트북에서 70B 파라미터 LLM을 돌릴 수 있다면 믿으시겠습니까? AMD Strix Halo 노트북 리뷰의 첫 번째 결론부터 말씀드리겠습니다 — 외장 GPU 없이 데스크톱 RTX 4090을 2.2배 앞지르는 AI 추론 성능, 이건 실화입니다.

AMD Strix Halo란 무엇인가: x86 최초의 통합 메모리 혁명
AMD Strix Halo(라이젠 AI Max 시리즈)는 AMD가 만든 칩렛 기반 APU로, Zen 5 CPU 코어와 RDNA 3.5 내장 GPU, 그리고 XDNA 2 NPU를 하나의 패키지에 통합한 제품입니다. 핵심 혁신은 통합 일관 메모리 아키텍처(Unified Coherent Memory)입니다. 최대 128GB LPDDR5x-8533 메모리를 CPU와 GPU가 공유하며, Variable Graphics Memory 기술로 최대 96GB까지 GPU VRAM으로 동적 할당할 수 있습니다.
이것이 왜 중요한지 설명하겠습니다. 지금까지 x86 노트북에서 대용량 VRAM이 필요한 작업 — 로컬 LLM 추론, 대형 3D 씬 렌더링, AI 이미지 생성 — 은 외장 GPU의 영역이었습니다. NVIDIA RTX 4090 Laptop조차 16GB VRAM이 한계입니다. Strix Halo는 이 벽을 통합 메모리로 허문 최초의 x86 APU입니다.
SKU 라인업과 핵심 스펙: 어떤 모델을 골라야 하나
Strix Halo는 네 가지 SKU로 출시되었습니다. 용도에 따라 선택이 달라집니다.
- Ryzen AI Max+ 395 — 16코어/32스레드, 5.1GHz 부스트, 40 RDNA 3.5 CU, 80MB 캐시. 플래그십 모델로 AI 추론과 크리에이티브 작업의 끝판왕입니다.
- Ryzen AI Max 390 — 12코어/24스레드, 5.0GHz 부스트, 32 CU, 76MB 캐시. 성능과 가격의 균형점입니다.
- Ryzen AI Max 385 — 8코어/16스레드, 32 CU. 게이밍에 최적화된 스위트 스팟 모델입니다.
- Ryzen AI Max Pro 380 — 6코어/12스레드, 4.9GHz 부스트, 16 CU, 22MB 캐시. 엔터프라이즈/엔트리 레벨입니다.
모든 SKU에 XDNA 2 NPU(50 TOPS)가 탑재되어 Windows Copilot+ PC 인증을 충족하며, 최대 128GB LPDDR5x-8533 메모리를 지원합니다. 실측 메모리 대역폭은 276GB/s로, Apple M4 Max의 546GB/s에는 미치지 못하지만 기존 x86 노트북과는 차원이 다른 수준입니다.
벤치마크 실전 테스트: 게이밍부터 AI 추론까지
게이밍: 내장 GPU가 RTX 4070 Laptop과 맞붙다
가장 놀라운 결과는 게이밍 벤치마크에서 나왔습니다. Laptop Mag의 테스트에 따르면 Cyberpunk 2077을 1600p 해상도에서 돌렸을 때 Strix Halo 내장 GPU는 39.4fps를 기록했고, NVIDIA RTX 4070 Laptop GPU는 37.3fps에 그쳤습니다. 내장 GPU가 전용 외장 GPU를 넘어선 것입니다.
HP ZBook Ultra G1a 리뷰에서는 Cyberpunk 2077을 2880×1800 해상도에서 Frame Generation을 활용해 거의 100fps에 근접하는 결과도 확인되었습니다. 물론 모든 타이틀에서 RTX 4070을 이긴 것은 아닙니다. 일부 게임에서는 RTX 4060 수준에 가까운 성능을 보이기도 했습니다. 하지만 “내장 GPU”라는 점을 감안하면 이 성능은 경이적입니다.
AI 추론: 데스크톱 RTX 4090을 2.2배 앞서다
AMD의 공식 벤치마크에 따르면 Ryzen AI Max+ 395는 Llama 70B Nemotron 추론에서 데스크톱 RTX 4090 대비 2.2배 빠른 성능을 기록했습니다. Stable Diffusion 3.5에서는 Apple M4 Pro(48GB) 대비 3.9배 빠른 결과를 보여줬습니다.
이 수치가 가능한 이유는 명확합니다. RTX 4090은 24GB VRAM이 한계이므로 70B 파라미터 모델을 양자화 없이 올릴 수 없습니다. 반면 Strix Halo는 96GB까지 VRAM으로 활용할 수 있어 모델 전체를 메모리에 올릴 수 있습니다. 대역폭에서는 불리하지만, 모델을 잘라서 스왑하는 오버헤드가 없기 때문에 전체 추론 속도에서 앞서는 것입니다.

CPU 멀티코어 및 크리에이티브 워크로드
CPU 순수 성능도 인상적입니다. V-Ray 6.0에서 33,285점, Cinebench 2024에서 1,596점을 기록했으며, 이는 HP ZBook Firefly G11A 대비 약 2배에 달하는 성능입니다. 128GB 통합 메모리는 대용량 비디오 편집, 3D 렌더링 등 큰 워킹 셋이 필요한 크리에이티브 작업에서 특히 빛을 발합니다.
실제 탑재 노트북: 지금 살 수 있는 선택지
2025년 5월 기준, Strix Halo를 탑재한 대표 노트북은 다음과 같습니다.
- HP ZBook Ultra G1a — 14인치 워크스테이션, 128GB 구성, $4,100. Strix Halo를 탑재한 첫 번째 주요 워크스테이션 노트북으로, 프로 크리에이터와 AI 개발자를 타겟으로 합니다.
- ASUS ROG Flow Z13 — 13인치 게이밍 태블릿, Ryzen AI Max 390 탑재, $2,099부터. CES 2025에서 공개되었으며 통합 메모리 APU의 휴대성 잠재력을 보여줍니다.
- Lenovo ThinkPad — Strix Halo 탑재, 최대 128GB, 온디바이스 드로잉 태블릿 옵션도 제공됩니다.
Strix Halo vs Apple M4 Max: 통합 메모리 양대 산맥 비교
통합 메모리 아키텍처에서 Apple Silicon은 선구자입니다. M4 Max와의 비교는 피할 수 없습니다.
- 메모리 대역폭: M4 Max 546GB/s vs Strix Halo 256GB/s. Apple이 약 2배 빠릅니다. LLM 토큰 생성 속도에 직접적인 영향을 줍니다.
- VRAM 유연성: Strix Halo는 최대 96GB를 GPU에 동적 할당 가능합니다. Apple은 총 128GB이지만 할당이 덜 유연합니다.
- GPU 컴퓨트: AMD 공식 벤치마크 기준 GPU 연산과 AI 추론에서 Strix Halo가 더 강합니다.
- 싱글 코어 CPU: M4 Max가 더 빠릅니다.
- 배터리 수명: Apple Silicon이 압도적으로 유리합니다.
- 소프트웨어 생태계: Strix Halo는 Windows와 Linux를 모두 지원하며, ROCm을 통한 GPU 컴퓨트가 가능합니다. Apple은 macOS로 제한됩니다.
- 가격: 고사양 구성에서 가격대는 비슷합니다.
결론적으로, LLM 토큰 생성 속도가 최우선이라면 M4 Max가, AI 모델 학습이나 GPU 컴퓨트 중심이라면 Strix Halo가, Windows/Linux 필수 환경이라면 Strix Halo가 유일한 선택지입니다.
내 생각: 28년차 엔지니어의 관점
28년간 음악 프로덕션과 기술 분야에서 일하면서 수많은 “게임 체인저”를 봐왔습니다. 대부분은 마케팅 수사에 불과했습니다. 하지만 Strix Halo의 통합 메모리 아키텍처는 진짜로 패러다임을 바꿀 기술이라고 판단합니다.
제가 주목하는 이유는 세 가지입니다. 첫째, 로컬 AI 추론의 민주화입니다. 지금까지 70B 파라미터 LLM을 로컬에서 돌리려면 최소 $2,000짜리 외장 GPU가 필요했습니다. Strix Halo는 이걸 노트북 한 대로 해결합니다. 음악 프로덕션에서 AI 기반 마스터링, 보컬 분리, 자동 믹싱 도구들이 점점 고도화되고 있는데, 이런 작업을 클라우드에 의존하지 않고 로컬에서 처리할 수 있다는 것은 레이턴시와 프라이버시 양면에서 의미가 큽니다.
둘째, 크리에이티브 워크플로우의 변화입니다. 128GB 통합 메모리는 대용량 멀티트랙 세션, 4K/8K 비디오 프록시, Dolby Atmos 오브젝트 기반 믹싱에서 메모리 부족으로 프로젝트를 나눠야 했던 문제를 해결합니다. 특히 라이브 공연 현장에서 노트북 하나로 백업 렌더링까지 돌릴 수 있다면, 제작 파이프라인 자체가 간소화됩니다.
셋째, 기술 컨설팅 관점에서 이 칩은 “스튜디오 서버를 노트북으로 대체할 수 있는가”라는 질문에 처음으로 “조건부 Yes”를 줄 수 있는 제품입니다. 물론 대역폭 격차(256GB/s vs M4 Max의 546GB/s)는 실시간 스트리밍 워크로드에서 병목이 될 수 있고, 아직 소프트웨어 최적화가 부족한 부분도 있습니다. 하지만 방향성 자체는 옳으며, 2세대 제품에서 이 격차가 좁혀질 것으로 예상합니다.
결론: 누구를 위한 노트북인가
AMD Strix Halo는 완벽하지 않습니다. 메모리 대역폭에서 Apple M4 Max에 뒤지고, 게이밍 성능은 타이틀에 따라 RTX 4060~4070 사이를 오갑니다. 배터리 수명도 Apple Silicon의 적수가 되지 못합니다. 하지만 이 칩이 해결하는 문제 — Windows/Linux 환경에서 대용량 VRAM이 필요한 로컬 AI 워크로드 — 는 다른 어떤 제품도 해결하지 못하는 영역입니다. 로컬 LLM 개발자, AI 연구원, 대용량 크리에이티브 워크로드를 다루는 전문가에게 Strix Halo는 현재 유일한 선택지이며, x86 통합 메모리 시대의 의미 있는 첫 걸음입니다.
AI 워크스테이션 구축이나 기술 자동화 파이프라인에 대해 더 알고 싶으시다면, Sean Kim에게 문의해 주세요.
매주 AI, 음악, 테크 트렌드를 이메일로 받아보세요.



