
OpenClaw NVIDIA 완전 해설: 젠슨 황이 ‘역사상 가장 중요한 소프트웨어’라 선언한 에이전틱 OS의 모든 것
3월 24, 2026
Terafab 칩 팩토리: 일론 머스크의 $250억 2nm 반도체 독립 선언
3월 24, 2026GPU 셰이더 안에서 뉴럴 네트워크를 직접 돌린다 — 불과 2년 전만 해도 공상에 가까웠던 이야기가 현실이 되었습니다. Microsoft가 GDC 2026에서 발표한 DirectX ML Shader Model 6.9은 Cooperative Vectors를 통해 HLSL 코드 내에서 인라인 뉴럴 렌더링을 가능하게 만들었고, AMD, NVIDIA, Intel, Qualcomm 4대 벤더가 모두 지원을 약속했습니다. 이것은 단순한 API 업데이트가 아니라, 실시간 그래픽 파이프라인의 근본적인 전환점입니다.

DirectX ML Shader Model 6.9이 가져온 핵심 변화
2026년 2월 26일, Microsoft는 Agility SDK 1.619를 통해 Shader Model 6.9 정식 버전을 출시했습니다. DXC 1.9.2602.16 컴파일러와 함께 배포된 이번 업데이트의 핵심은 세 가지입니다. 첫째, 최대 1024개 요소를 지원하는 Long Vectors가 도입되어 HLSL 내에서 대규모 벡터 연산이 가능해졌습니다. 둘째, 16비트 부동소수점 특수 함수가 추가되어 뉴럴 네트워크의 추론 정밀도와 성능 사이의 균형을 세밀하게 조절할 수 있게 되었습니다. 셋째, DXR 1.2와 함께 Opacity Micromaps(OMM)과 Shader Execution Reordering(SER)이 도입되어 레이 트레이싱 파이프라인의 효율이 크게 향상되었습니다.
Long Vectors의 등장은 특히 주목할 만합니다. 기존 HLSL에서 벡터는 최대 4개 요소(float4)로 제한되었기 때문에, 뉴럴 네트워크의 가중치 행렬이나 중간 활성화 값을 다루기 위해서는 별도의 컴퓨트 셰이더나 외부 ML 프레임워크를 호출해야 했습니다. 1024개 요소의 Long Vectors는 이 제약을 극적으로 완화하여, 작은 규모의 뉴럴 네트워크를 픽셀 셰이더 내부에서 직접 실행할 수 있는 기반을 마련했습니다.
Cooperative Vectors: 뉴럴 렌더링의 핵심 메커니즘
Cooperative Vectors는 DirectX ML Shader Model 6.9의 가장 혁신적인 기능입니다. Microsoft DevBlogs의 기술 문서에 따르면, 이 기술의 원리는 웨이브(wave) 내 개별 스레드들의 벡터-행렬 곱셈 요청을 수집하여 가속화된 행렬-행렬 연산으로 결합하는 것입니다. 쉽게 말해, GPU의 텐서 코어를 활용하여 여러 픽셀 셰이더 스레드가 협력적으로 뉴럴 네트워크 추론을 수행하는 방식입니다.
이것이 왜 중요한지 구체적으로 살펴보겠습니다. 전통적인 뉴럴 렌더링 방식에서는 렌더링 파이프라인을 중단하고, 별도의 ML 추론 패스를 실행한 뒤 그 결과를 다시 셰이더로 가져와야 했습니다. 이 과정에서 발생하는 컨텍스트 스위칭과 메모리 전송 오버헤드는 실시간 렌더링에 치명적이었습니다. Cooperative Vectors는 이 문제를 근본적으로 해결합니다. 뉴럴 네트워크가 셰이더 코드 안에서 인라인으로 실행되므로, GPU 전체를 점유하지 않으면서도 픽셀 단위의 뉴럴 추론이 가능해집니다.
실제 활용 사례를 보면 이 기술의 잠재력이 더욱 선명해집니다. Neural Texture Compression(뉴럴 텍스처 압축)은 기존 BC7 같은 블록 압축 방식 대비 동일 품질에서 훨씬 높은 압축률을 달성할 수 있습니다. 텍스처 샘플링 시점에 소형 뉴럴 네트워크가 디코딩을 수행하므로, 메모리 대역폭을 절약하면서도 시각적 품질 저하 없이 고해상도 텍스처를 실시간으로 렌더링할 수 있습니다. Neural Radiance Caching(뉴럴 레이디언스 캐싱)은 광선 추적에서 계산 비용이 큰 간접 조명을 뉴럴 네트워크로 근사하여, 글로벌 일루미네이션의 품질을 유지하면서 렌더링 시간을 대폭 단축합니다.
DirectX Linear Algebra와 Compute Graph Compiler: 다음 단계의 로드맵
Microsoft의 GDC 2026 발표에서 가장 미래지향적인 부분은 Cooperative Vectors를 넘어서는 두 가지 새로운 구성 요소입니다. DirectX Linear Algebra(DXLA)는 기존 Cooperative Vectors의 벡터-행렬 연산과 행렬-행렬 연산을 하나의 통합된 API로 묶습니다. 2026년 4월 퍼블릭 프리뷰가 예정되어 있으며, 향후 Shader Model 릴리스에서 정식 통합될 예정입니다.
DXLA가 개별 선형 대수 연산을 다룬다면, DirectX Compute Graph Compiler는 한 단계 더 높은 추상화를 제공합니다. ML 모델의 전체 연산 그래프를 받아서 GPU에 최적화된 네이티브 코드로 컴파일하는 이 도구는, 개발자가 ONNX 같은 표준 형식으로 모델을 정의하면 DirectX가 자동으로 최적의 GPU 실행 계획을 생성합니다. 2026년 여름 프라이빗 프리뷰가 계획되어 있으며, 이것이 완성되면 게임 개발자는 별도의 ML 프레임워크 없이 DirectX만으로 복잡한 뉴럴 렌더링 파이프라인을 구축할 수 있게 됩니다.
여기서 주목해야 할 전략적 의미가 있습니다. Microsoft는 ML 추론을 운영체제 수준의 그래픽 API에 네이티브로 통합하려는 것입니다. TensorFlow나 PyTorch 같은 범용 ML 프레임워크가 아니라, GPU 드라이버와 직접 소통하는 저수준 API에서 뉴럴 렌더링을 처리하겠다는 것입니다. 이는 지연 시간과 오버헤드를 최소화할 수 있는 가장 효율적인 접근법이며, 4대 GPU 벤더가 모두 동의한 업계 표준화의 시작이기도 합니다.

GDC 2026에서 공개된 나머지 DirectX 혁신들
DirectX ML만이 GDC 2026의 전부는 아니었습니다. Microsoft는 네 가지 주요 세션을 통해 DirectX 생태계 전반의 로드맵을 공개했습니다. DirectStorage에 Zstandard 압축이 추가되어 게임 로딩 시간이 더욱 단축되며, PIX 디버깅 도구는 10년 만의 최대 업데이트를 통해 콘솔 수준의 GPU 프로파일링을 Windows에서 제공합니다. 특히 Advanced Shader Delivery는 스토어프런트를 통해 사전 컴파일된 셰이더를 배포함으로써, 많은 게이머가 경험하는 셰이더 스터터(끊김) 문제를 근본적으로 해결합니다.
WCCFTech의 보도에 따르면, Microsoft는 DXR 2.0도 예고했습니다. 세부 사항은 아직 공개되지 않았지만, Cooperative Vectors와 DXLA의 성숙과 함께 차세대 레이 트레이싱 API가 뉴럴 렌더링을 네이티브로 통합할 가능성이 높습니다. 이는 렌더링 파이프라인에서 ML이 더 이상 부가 기능이 아니라 핵심 구성 요소가 된다는 신호입니다.
AMD와의 파트너십도 눈여겨볼 부분입니다. AMD GPUOpen을 통해 발표된 협력 내용을 보면, DirectX ML과 DirectX Linear Algebra에 대한 크로스 벤더 지원이 명확히 확인됩니다. NVIDIA의 텐서 코어뿐 아니라 AMD의 AI 가속기, Intel의 XMX 엔진, Qualcomm의 NPU까지 — Cooperative Vectors는 특정 하드웨어에 종속되지 않는 범용 뉴럴 렌더링 인터페이스로 자리잡을 전망입니다.
개발자에게 의미하는 것: 지금 준비해야 할 것들
당장 Shader Model 6.9을 프로덕션에 적용하기는 이릅니다. 하지만 로드맵은 명확합니다. 2026년 Q1에 SM 6.9 정식 릴리스(완료), Q2에 DirectX Linear Algebra 퍼블릭 프리뷰, 여름에 Compute Graph Compiler 프라이빗 프리뷰, 그리고 향후 SM 릴리스에서 통합 선형 대수 API 정식 출시. 이 타임라인은 2027년이면 주요 게임 엔진들이 뉴럴 렌더링을 기본 기능으로 탑재할 수 있다는 것을 의미합니다.
지금 당장 개발자가 할 수 있는 것은 Agility SDK 1.619를 설치하고 Long Vectors와 16비트 부동소수점 특수 함수를 실험해보는 것입니다. Neural Texture Compression의 프로토타입을 만들어보는 것도 좋은 시작점입니다. 작은 뉴럴 네트워크(8-16개 뉴런 레이어)를 HLSL 내에서 Cooperative Vectors로 실행하는 데모를 구현해보면, 이 기술의 가능성과 현재의 한계를 동시에 체감할 수 있습니다.
결론적으로, DirectX ML Shader Model 6.9과 Cooperative Vectors는 실시간 렌더링의 패러다임을 바꾸는 첫 번째 구체적인 발걸음입니다. 뉴럴 텍스처 압축, 뉴럴 레이디언스 캐싱, 그리고 앞으로 등장할 더 많은 뉴럴 렌더링 기법들이 GPU 셰이더 안에서 네이티브로 실행되는 시대가 열리고 있습니다. DirectX Linear Algebra와 Compute Graph Compiler가 완성되면, 게임 그래픽은 래스터라이제이션과 레이 트레이싱에 이어 세 번째 렌더링 패러다임 — 뉴럴 렌더링 — 을 본격적으로 수용하게 될 것입니다.
DirectX ML 파이프라인 구축이나 GPU 기반 자동화 시스템에 대해 더 알고 싶으시다면, Sean Kim에게 문의하세요.
매주 AI, 음악, 테크 트렌드를 이메일로 받아보세요.



