Canon EOS R5 Mark II 리뷰: 6개월 실사용 후 밝혀진 7가지 솔직한 진실

5월 29, 2025

Superbooth 2025: 모듈러 신스 & 유로랙 신제품 TOP 10 하이라이트 총정리

5월 30, 2025

Google I/O 2025 Gemini 2.5 Pro & Flash 총정리 — 10일 후 현실 점검

Published by Sean Kim on 5월 30, 2025

Google I/O 2025 Gemini 2.5 Pro — 벤치마크의 새로운 기준

5월 20일, Sundar Pichai는 Google I/O 2025 키노트 무대에서 AI를 중심 테마로 내세웠습니다. 그리고 그 핵심에는 Gemini 2.5 Pro가 있었습니다. Google Blog에 따르면, Gemini 2.5 Pro는 LMArena 리더보드에서 모든 카테고리를 석권한 최초의 모델입니다. 단일 벤치마크가 아니라 코딩, 수학, 추론, 멀티모달 전 영역에서 1위를 차지했다는 뜻입니다.

구체적인 수치를 보면 그 위력이 더 분명해집니다. Humanity’s Last Exam에서 18.8%로 최고 기록을 세웠고, MMMU 멀티모달 추론 벤치마크에서 84.0%를 달성했습니다. LiveCodeBench에서는 경쟁 수준의 코딩 문제에서도 선두를 유지하고 있으며, GPQA와 AIME 2025에서는 테스트 타임 컴퓨트 트릭 없이 최고 성적을 거뒀습니다. WebDev Arena 리더보드에서도 세계 1위입니다.

Google I/O 2025 Gemini 2.5 Pro 벤치마크 결과 — Gemini 2.5 Pro Deep Think 벤치마크 성적표 (출처: Google DeepMind)

Deep Think 모드 — 병렬 사고의 실체

Gemini 2.5 Pro의 가장 주목할 기능은 Deep Think 모드입니다. Google DeepMind Blog에 따르면, Deep Think는 병렬 사고(parallel thinking) 기법을 활용하여 복잡한 추론 문제에서 한 차원 높은 성능을 끌어냅니다. 2025 USAMO(미국 수학 올림피아드)에서 인상적인 점수를 기록했고, 이는 단순한 패턴 매칭이 아니라 진짜 수학적 추론 능력을 보여주는 결과입니다.

개발자 관점에서 보면, Deep Think는 기존의 Chain-of-Thought 방식과는 다른 접근입니다. 하나의 사고 경로를 순차적으로 따라가는 대신, 여러 추론 경로를 동시에 탐색하고 가장 유망한 결과를 종합합니다. 이 방식 덕분에 복잡한 코딩 문제나 다단계 추론에서 기존 모델 대비 큰 폭의 성능 향상이 가능했습니다.

현재 Gemini 2.5 Pro는 Google AI Studio와 Gemini Advanced에서 사용할 수 있으며, Vertex AI에도 곧 출시될 예정입니다. 가격은 입력 100만 토큰당 $1.25, 출력 100만 토큰당 $10.00으로, 성능 대비 경쟁력 있는 가격대를 유지하고 있습니다.

Gemini 2.5 Flash — 효율성의 재정의

2.5 Pro가 성능의 천장을 높였다면, 2.5 Flash는 효율성의 바닥을 낮췄습니다. Google DeepMind에 따르면, Gemini 2.5 Flash는 이전 버전 대비 20-30% 적은 토큰을 사용하면서도 추론, 멀티모달, 코드, 장문 컨텍스트 벤치마크 전반에서 성능이 향상되었습니다.

LMArena 리더보드에서 2.5 Pro에 이어 2위를 차지했다는 것은, Flash가 단순한 “경량 모델”이 아니라 대부분의 실용적 작업에서 최상위 수준의 성능을 제공한다는 의미입니다. 6월부터는 Gemini 앱의 기본 모델로 전환될 예정이며, 네이티브 오디오 출력 기능도 추가됩니다.

Google Cloud Blog에 따르면, 2.5 Flash는 6월 초 Google AI Studio와 Vertex AI에서 정식 출시(GA)되며, 2.5 Pro는 그 직후에 Vertex AI에서 GA됩니다. 엔터프라이즈 환경에서 즉시 배포 가능한 옵션이 갖춰진다는 뜻입니다.

https://www.youtube.com/watch?v=5sEA2VRMhEk

Gemini을 넘어서 — Veo 3, Flow, 그리고 크리에이티브 AI의 도약

Google I/O 2025에서 Gemini 모델만 발표된 것은 아닙니다. 크리에이티브 AI 영역에서도 상당한 진전이 있었습니다. Veo 3는 AI 비디오 생성의 새로운 기준을 제시했습니다. 단순히 영상을 만드는 것이 아니라, 효과음, 배경 소음, 심지어 대화까지 네이티브로 생성합니다. OpenAI의 Sora가 촉발한 AI 비디오 경쟁에서 Google이 본격적으로 판을 키운 셈입니다.

Imagen 4도 크게 개선되었습니다. 타이포그래피 처리, 레이아웃 핸들링, 시각 디자인 전반이 향상되어 실제 디자인 작업에 투입할 수 있는 수준에 한 걸음 더 다가갔습니다. 그리고 이 두 기술을 결합한 것이 바로 Flow입니다. Flow는 Veo 3와 Imagen 4를 활용한 AI 영화제작 도구로, 8초 길이의 비디오 클립을 생성할 수 있습니다. AI Pro 플랜($19.99/월, 기존 AI Premium에서 리브랜딩)을 통해 사용할 수 있으며, 전문 AI 비디오 플랫폼들과 정면 승부를 선언한 것입니다.

Google I/O 2025 Gemini AI 발표 무대 — Google I/O 2025 키노트 무대 (출처: Google Blog)

Project Astra, Mariner, 그리고 AI 에이전트의 시대

이번 I/O에서 가장 미래지향적인 발표는 AI 에이전트 관련 프로젝트들이었습니다. Project Astra는 범용 AI 어시스턴트로, 스마트폰과 안경 사이를 컨텍스트 손실 없이 오가며 작동합니다. 단순한 음성 비서를 넘어, 카메라로 보는 것을 이해하고 대화하는 수준으로 진화했습니다.

Project Mariner는 컴퓨터 사용(computer use) 기능을 Gemini API에 탑재합니다. Android Central에 따르면, 데모에서는 AI Mode가 야구 경기 티켓을 자율적으로 검색하고 예약하는 모습을 보여줬습니다. 단순 검색이 아니라 실제 작업을 완료하는 에이전트 — 이것이 Google이 그리는 검색의 미래입니다. 2025년 여름에 AI Mode on Search에 통합될 예정입니다.

개발자를 위한 에이전트도 등장했습니다. Jules는 자율 비동기 AI 코딩 에이전트로, 퍼블릭 베타에 진입했습니다. Google Developers Blog에 따르면, Jules는 코드베이스 전체를 Google Cloud VM에 클론하여 전체 프로젝트 컨텍스트를 갖고 작업합니다. 비동기로 동작하기 때문에, 개발자가 다른 작업을 하는 동안 Jules가 별도로 코딩 작업을 처리할 수 있습니다.

검색, 하드웨어, 그리고 나머지 100가지

Google은 100개 이상의 발표를 쏟아냈고, 검색과 하드웨어 영역에서도 주요 변화가 있었습니다. AI Mode는 Google Search에 새로운 챗봇 탭으로 추가되어, 복잡한 쿼리에 Gemini 2.5 기반 대화형 응답을 제공합니다. TechRadar에 따르면, Search Live는 Project Astra 기술을 활용해 카메라 기반 대화형 검색을 가능하게 합니다. 미국 내 모든 사용자에게 순차 배포 중입니다.

Gemini Live는 카메라와 화면 공유 기능이 Android와 iOS에서 무료로 제공됩니다. 구독 모델도 재편되었는데, 기존 AI Premium은 AI Pro($19.99/월)로 리브랜딩되었고, 최상위 AI Ultra 플랜($249.99/월)이 신설되어 가장 강력한 모델과 최대 사용량을 제공합니다.

하드웨어 측면에서는 Android XR이 헤드셋에서 스마트 안경으로 확장됩니다. Project Aura라는 이름으로 Xreal과 파트너십을 맺었고, Google Beam은 Zoom 및 HP와 협력하여 3D 홀로그래픽 원격 커뮤니케이션 디바이스를 선보였습니다. NotebookLM은 Audio Overviews 기능을 추가하여 문서를 자연스러운 오디오 요약으로 변환합니다.

열흘 후 평가 — 실제로 중요한 것은 무엇인가

100개가 넘는 발표 중에서 실질적으로 가장 큰 임팩트를 가질 것은 세 가지라고 봅니다. 첫째, Gemini 2.5 Flash의 효율성 개선입니다. 대부분의 실제 애플리케이션은 최고 성능이 아니라 “충분히 좋은 성능을 더 저렴하게”를 필요로 합니다. 20-30% 토큰 절감은 대규모 서비스 운영에서 직접적인 비용 절감으로 이어집니다.

둘째, Project Mariner와 AI 에이전트의 실용화입니다. 검색에서 실제 작업 완료까지 이어지는 에이전트 기능은, 실현만 된다면 인터넷 사용 방식 자체를 바꿀 수 있습니다. 티켓 예약 데모가 실제 서비스에서도 그만큼 매끄럽게 작동할지는 지켜봐야 하지만, 방향 자체는 명확합니다.

셋째, Veo 3의 사운드 통합 비디오 생성입니다. 영상에 효과음과 대화를 네이티브로 생성하는 것은 기존 AI 비디오 도구들이 해결하지 못한 영역이며, 콘텐츠 제작 파이프라인을 근본적으로 변화시킬 잠재력이 있습니다. Google I/O 2025 Gemini 발표가 보여준 것은 단순한 모델 업그레이드가 아니라, AI가 도구에서 에이전트로, 텍스트에서 멀티모달로 전환하는 구체적인 로드맵이었습니다.

AI 기반 자동화 시스템 구축이나 기술 컨설팅이 필요하시다면, 편하게 문의해 주세요.

기술 상담 받기 →

블로그 더 보기 →

매주 AI, 음악, 테크 트렌드를 이메일로 받아보세요.

Sean Kim

Comments are closed.

Canon EOS R5 Mark II 리뷰: 6개월 실사용 후 밝혀진 7가지 솔직한 진실

Superbooth 2025: 모듈러 신스 & 유로랙 신제품 TOP 10 하이라이트 총정리

Canon EOS R5 Mark II 리뷰: 6개월 실사용 후 밝혀진 7가지 솔직한 진실

Superbooth 2025: 모듈러 신스 & 유로랙 신제품 TOP 10 하이라이트 총정리

Google I/O 2025 Gemini 2.5 Pro — 벤치마크의 새로운 기준

Deep Think 모드 — 병렬 사고의 실체

Gemini 2.5 Flash — 효율성의 재정의

Gemini을 넘어서 — Veo 3, Flow, 그리고 크리에이티브 AI의 도약

Project Astra, Mariner, 그리고 AI 에이전트의 시대

검색, 하드웨어, 그리고 나머지 100가지

열흘 후 평가 — 실제로 중요한 것은 무엇인가

Mistral Small 4 리뷰: 119B MoE 오픈소스 모델이 GPT-OSS 120B를 40% 낮은 지연시간으로 따라잡은 방법

OpenAI Codex Subagents GA: 멀티 에이전트 병렬 코딩 작동 원리, 실제 결과, Claude Code 비교

Adobe Firefly 커스텀 모델 퍼블릭 베타 — 이미지 10장이면 나만의 AI가 완성됩니다 (2026)