2025년 최고의 스마트폰: iPhone 17 Pro Max vs Galaxy S25 Ultra vs Pixel 10 Pro — 승자는?

12월 3, 2025

2025년 12월 연말 스튜디오 딜 총정리: 최대 96% 할인 포스트 홀리데이 클리어런스 세일 12선

12월 4, 2025

AWS re:Invent 2025 총정리: 놓치면 안 되는 AI·ML 핵심 발표 7가지

Published by Sean Kim on 12월 4, 2025

1. Amazon Nova 2 패밀리: AWS re:Invent 2025 최대 발표

가장 큰 화제는 단연 Amazon Nova 2 모델 패밀리였습니다. AWS는 단순한 업그레이드가 아닌, 텍스트·음성·멀티모달을 아우르는 완전히 새로운 세대의 파운데이션 모델을 공개했습니다. 모든 모델이 100만 토큰 컨텍스트 윈도우를 지원합니다.

Nova 2 Lite는 비용 효율성의 끝판왕입니다. 1K 입력 토큰당 $0.00125, 출력 토큰당 $0.0025로 경쟁사 대비 약 10배 저렴합니다. 대량 처리가 필요한 프로덕션 워크로드에서 토큰 단가가 사업성을 좌우하는 시대에, 이 가격은 게임 체인저입니다.

Nova 2 Pro는 성능 중심 티어로, 추론·코딩·지시 따르기 벤치마크에서 전 세대를 일관되게 압도합니다. 엔터프라이즈 애플리케이션에 적합한 모델입니다.

Nova Sonic은 실시간 음성-음성 처리를 도입했습니다. 텍스트 모델에 음성 인식을 덧붙인 것이 아니라, 톤·속도·문맥을 이해하는 네이티브 양방향 오디오 처리입니다. 1K 음성 입력 토큰당 $0.003으로, 음성 우선 애플리케이션을 구축하는 팀에게 경제성 자체를 바꿔놓는 발표입니다.

Nova Omni는 텍스트·이미지·오디오·비디오를 단일 통합 모델로 처리하는 멀티모달 플래그십입니다. 100만 토큰 컨텍스트 덕분에 수시간 분량의 영상이나 수천 페이지의 문서를 입력해도 일관된 응답을 얻을 수 있습니다.

2. Amazon Bedrock AgentCore: AI 에이전트의 관제탑

Nova 2가 두뇌라면, Bedrock AgentCore는 신경계입니다. 이 서비스는 엔터프라이즈 AI 도입의 가장 큰 걸림돌이었던 거버넌스와 통제 문제를 정면으로 해결합니다. 정책 컨트롤로 AI 에이전트의 행동 범위를 정의하고, 품질 평가 시스템으로 에이전트 출력을 사용자에게 전달하기 전에 검증하며, 에피소딕 메모리로 과거 상호작용에서 학습하도록 설계되었습니다.

양방향 스트리밍 기능도 주목할 만합니다. 에이전트가 실시간 대화를 유지하면서 동시에 백그라운드 작업을 수행할 수 있어, 사용자 경험이 훨씬 자연스러워집니다. AWS는 또한 Bedrock에 18개의 새로운 오픈 웨이트 모델을 추가하여 총 약 100개의 서버리스 모델을 제공합니다. 이 모델 다양성 덕분에 팀은 인프라 관리 없이 적절한 모델을 적절한 작업에 매칭할 수 있습니다.

3. 강화 파인튜닝: 대규모 레이블 데이터 없이 정확도 66% 향상

많은 참석자들이 놓쳤지만, ML 엔지니어에게 가장 실질적인 영향을 미칠 발표입니다. AWS가 공개한 강화 파인튜닝(Reinforcement Fine-Tuning)은 대규모 레이블 데이터셋 없이도 기본 모델 대비 66% 정확도 향상을 달성했습니다.

기존 파인튜닝은 수천 개의 정교하게 큐레이션된 학습 데이터가 필요합니다. 강화 파인튜닝은 대신 보상 신호를 활용합니다. 모든 훈련 데이터를 수동으로 레이블링하는 대신, 결과 기반 피드백으로 “좋은 결과”를 정의하는 방식입니다. 법률 문서 분석, 의료 영상 해석, 금융 리스크 평가 같은 도메인 특화 애플리케이션에서 진입 장벽을 극적으로 낮추는 기술입니다.

https://www.youtube.com/watch?v=LFVVr42zTPY

4. Kiro 자율 에이전트와 Nova Act: 실제로 ‘행동’하는 AI

Garman의 키노트 테마가 가장 구체적으로 실현된 발표입니다. Kiro는 AWS의 자율 코딩 에이전트로, 최대 10개의 작업을 동시에 처리하고, 세션 간 영속 메모리를 유지하며, 여러 리포지토리를 넘나들며 작업합니다. 단순 코드 자동완성을 넘어 프로젝트 컨텍스트를 이해하고, 다단계 구현을 계획하고, 자율적으로 실행합니다.

Nova Act는 에이전틱 AI를 브라우저로 가져왔습니다. 90% 이상의 작업 신뢰도로 웹 인터페이스를 탐색하고, 폼을 채우고, 정보를 추출하고, 워크플로우를 완료합니다. 기존 브라우저 자동화 접근법이 60-70% 성공률에 머물렀던 것을 감안하면, 90%+ 신뢰도는 실제 프로덕션 투입이 가능한 임계점을 넘긴 수치입니다.

AWS re:Invent 2025 AI 발표 총정리 — AWS re:Invent 2025 컨퍼런스 하이라이트 (출처: About Amazon)

” alt=”AWS re:Invent 2025 AI 서비스 발표 개요”/>

AWS re:Invent 2025 주요 AI·ML 서비스 발표 (출처: AWS)

5. Amazon SageMaker HyperPod: 체크포인트 없는 훈련의 혁신

대규모 AI 모델 훈련은 비용이 막대하고, 그 비용의 상당 부분은 다운타임에서 발생합니다. 하드웨어 장애, 노드 교체, 체크포인트 오버헤드가 대표적입니다. SageMaker HyperPod의 새로운 체크포인트리스 훈련(Checkpointless Training)은 클러스터 변경에 자동으로 적응하는 탄력적 훈련으로 다운타임을 80% 이상 감소시킵니다.

기존 환경에서는 수일간의 훈련 중 노드 하나가 고장나면 마지막 체크포인트까지의 진행이 사라지거나, 고비용의 체크포인트 스토리지를 유지해야 했습니다. HyperPod는 훈련 상태를 클러스터 전체에 분산 저장하여 개별 노드 장애에서도 살아남는 방식을 채택했습니다. 파운데이션 모델이나 대규모 도메인 특화 모델을 훈련하는 조직에게는 반복 주기 단축과 컴퓨팅 비용 절감으로 직결됩니다.

6. Trainium3과 P6e GB300: 실리콘 전쟁의 가속화

AWS는 AI 칩 전략에서 양쪽 모두를 공략하고 있습니다. Trainium3는 Amazon의 첫 3nm AI 훈련 칩으로, UltraServer당 144개 칩 탑재에 이전 세대 대비 최대 50% 비용 절감을 달성합니다. 3nm 공정은 와트당 성능을 크게 향상시키는데, 데이터센터 규모에서 이 효율성 차이는 막대합니다.

동시에 AWS는 NVIDIA 생태계를 선호하는 고객을 위해 NVIDIA GB300 GPU 기반 P6e 인스턴스도 발표했습니다. TechCrunch가 분석한 대로, 이 양면 전략은 특정 칩 전략에 집중하는 Google, Azure 대비 AWS만의 차별화 포인트입니다. Amazon 자체 실리콘으로 최대 비용 효율을, NVIDIA 호환성으로 기존 코드 이식성을 동시에 제공합니다.

7. Amazon S3 Vectors GA: S3 스케일의 벡터 검색

마지막으로 주목해야 할 발표는 Amazon S3 Vectors의 정식 출시(GA)입니다. 수치가 모든 것을 말해줍니다. 인덱스당 20억 벡터 저장(40배 증가), 약 100ms 쿼리 지연 시간, 전문 벡터 데이터베이스 대비 최대 90% 비용 절감.

이것은 독립형 벡터 데이터베이스 시장 전체를 위협하는 전략적 포석입니다. 세계에서 가장 널리 사용되는 오브젝트 스토리지인 S3에 벡터 검색을 직접 내장함으로써, 많은 사용 사례에서 별도의 벡터 DB 인프라를 제거합니다. RAG 파이프라인이나 시맨틱 검색 앱이 이미 AWS에서 돌아가고 있다면 마이그레이션 경로도 단순하고 비용 절감도 실질적입니다. AI 기반 검색을 구축하는 스타트업에게는 스택에서 인프라 구성 요소 하나가 통째로 사라지는 셈입니다.

2026년을 준비하는 빌더들에게

이 7가지 발표를 종합하면 명확한 서사가 보입니다. AWS는 커스텀 실리콘(Trainium3)으로 훈련 효율성을, 파운데이션 모델(Nova 2)로 지능을, 에이전트 프레임워크(Bedrock AgentCore, Kiro, Nova Act)로 자율 운영을, 스토리지(S3 Vectors)로 데이터 레이어를 구축하며 AI 스택의 전 계층을 완성하고 있습니다.

가장 중요한 변화는 특정 제품이 아닙니다. “기능으로서의 AI”에서 “에이전트로서의 AI”로의 전환입니다. 모든 주요 발표가 프롬프트에 응답하는 것이 아닌, 적절한 가드레일 하에서 독립적으로 행동하는 AI 시스템을 지향합니다. 개발자, 플랫폼 엔지니어, 기술 리더 모두에게 메시지는 분명합니다 — 2026년은 프로덕션급 AI 에이전트의 해가 될 것이며, AWS는 그 미래에 플랫폼을 걸고 있습니다.

Nova 2로 비용 효율적인 추론을 탐색하든, Trainium3로 훈련 워크로드를 평가하든, Bedrock AgentCore로 첫 자율 에이전트를 구축하든, 진입 장벽은 그 어느 때보다 낮아졌습니다. 진짜 질문은 이 도구들을 도입할지 여부가 아니라, 경쟁자보다 얼마나 빠르게 기존 워크플로우에 통합할 수 있느냐입니다.

AI 인프라 구축이나 클라우드 아키텍처 설계에 대해 더 깊은 논의가 필요하시다면, 기술 컨설팅을 통해 도움드리겠습니다.

기술 상담 받기 →

매주 AI, 음악, 테크 트렌드를 이메일로 받아보세요.

Sean Kim

Comments are closed.

2025년 최고의 스마트폰: iPhone 17 Pro Max vs Galaxy S25 Ultra vs Pixel 10 Pro — 승자는?

2025년 12월 연말 스튜디오 딜 총정리: 최대 96% 할인 포스트 홀리데이 클리어런스 세일 12선

2025년 최고의 스마트폰: iPhone 17 Pro Max vs Galaxy S25 Ultra vs Pixel 10 Pro — 승자는?

2025년 12월 연말 스튜디오 딜 총정리: 최대 96% 할인 포스트 홀리데이 클리어런스 세일 12선

1. Amazon Nova 2 패밀리: AWS re:Invent 2025 최대 발표

2. Amazon Bedrock AgentCore: AI 에이전트의 관제탑

3. 강화 파인튜닝: 대규모 레이블 데이터 없이 정확도 66% 향상

4. Kiro 자율 에이전트와 Nova Act: 실제로 ‘행동’하는 AI

5. Amazon SageMaker HyperPod: 체크포인트 없는 훈련의 혁신

6. Trainium3과 P6e GB300: 실리콘 전쟁의 가속화

7. Amazon S3 Vectors GA: S3 스케일의 벡터 검색

2026년을 준비하는 빌더들에게

2026년 음악 카탈로그 투자 붐: 204억 달러 시대, 왜 월가는 히트곡에 올인하는가

워너 뮤직 레벨레이터 인수: 3대 메이저의 인디 유통 삼파전이 시작됐다 (2026 분석)

AI 음악 라이선싱 2026: 5억 달러 소송이 만든 7가지 업계 대전환