
Udio Sessions 완전 분석: 인페인팅과 섹션별 편집으로 AI 음악의 판이 바뀌다 (2025년 7월)
7월 1, 2025
Roland Jupiter-X 2025 업데이트: 9개 신규 ZEN-Core 사운드 팩, Legendary ACB 리프레시, GALAXIAS 1.5 연동
7월 3, 2025OpenAI가 세 가지 핵심 기능을 하나로 합쳤습니다 — 그리고 ChatGPT는 더 이상 예전의 ChatGPT가 아닙니다. 새로운 ChatGPT Agent는 단순히 질문에 답하는 수준을 넘어, 웹사이트를 직접 탐색하고, 코드를 실행하고, 리서치를 종합하며, 사용자를 대신해 실제 행동을 취합니다. GPT-4 이후 가장 큰 아키텍처 전환입니다.
ChatGPT Agent란? 세 가지 시스템의 통합
ChatGPT Agent의 핵심은 기존에 분리되어 있던 세 가지 역량을 하나로 통합한 에이전틱 시스템입니다. Operator의 비주얼 브라우저를 통한 웹사이트 상호작용, Deep Research의 다중 소스 정보 종합 능력, 그리고 ChatGPT의 대화형 지능이 하나의 인터페이스에서 작동합니다. 사용자의 요청에 따라 에이전트가 어떤 도구를 사용할지 스스로 판단합니다.
쉽게 말해, 이전에는 “경쟁사 3곳을 분석해서 슬라이드 덱을 만들어줘”라고 하면 직접 브라우징하고, 데이터를 복사하고, 결과물을 정리해야 했습니다. 이제 ChatGPT Agent가 경쟁사 웹사이트 탐색부터 데이터 추출, 분석 코드 실행, 편집 가능한 프레젠테이션 생성까지 전 과정을 한 번의 프롬프트로 처리합니다.

기술 스택: CUA 모델과 강화학습
ChatGPT Agent의 기반은 Computer-Using Agent(CUA) 모델입니다. GPT-4o의 비전 역량과 강화학습으로 훈련된 고급 추론 능력이 결합되어 있습니다. 이 모델은 화면에 보이는 것을 실제로 “볼” 수 있으며, 어디를 클릭하고, 무엇을 입력하고, 어디를 스크롤할지 스스로 판단합니다.
에이전트의 도구 상자에는 네 가지 핵심 기능이 포함되어 있습니다:
- 비주얼 브라우저(Visual Browser) — GUI를 통해 웹과 상호작용합니다. 항공권 예약, 폼 작성, 여러 탭에서의 제품 비교 등 복잡한 다단계 웹 탐색을 처리합니다
- 텍스트 기반 브라우저 — 전체 비주얼 렌더링이 필요 없는 간단한 추론 기반 웹 쿼리에 사용되며, 더 빠른 정보 검색 결과를 제공합니다
- 터미널(Terminal) — 제한된 네트워크 접근으로 코드를 실행하며, 데이터 분석, 파일 처리, 연산 작업을 대화 내에서 직접 수행합니다
- API 접근 — ChatGPT Connectors를 통해 Gmail, GitHub, Google Drive 등 외부 서비스와 연결하여 데이터를 가져옵니다
실제 사용 사례: ChatGPT Agent가 하는 일
라이브 발표에서 OpenAI는 여러 설득력 있는 워크플로우를 시연했습니다. Sam Altman은 시스템의 철학을 “ChatGPT Agent의 1차 목표는 고도로 협업적인 것”이라고 설명했습니다. 사용자는 작업 중간에 개입하고, 중요 단계 전에 확인을 요청하며, 에이전트의 방향을 즉석에서 전환할 수 있습니다.
발표에서 공개된 주요 데모입니다:
- 캘린더 인텔리전스 — “내 캘린더를 확인하고 최신 뉴스를 기반으로 다가오는 고객 미팅 브리핑을 만들어줘.” 에이전트가 Connectors로 캘린더에 접근한 뒤, 각 고객을 브라우저로 조사하여 컨텍스트가 포함된 브리핑 문서를 제공합니다
- 쇼핑 자동화 — “4인분 일본식 아침을 만들기 위한 재료를 계획하고 구매해줘.” 에이전트가 레시피를 조사하고, 인근 매장에서 재료 가용성을 확인하며, 지원되는 이커머스 사이트에서 주문까지 진행합니다
- 경쟁 분석 — “경쟁사 3곳을 분석해서 슬라이드 덱을 만들어줘.” 경쟁사 웹사이트 탐색, 데이터 추출, 분석 코드 실행, 편집 가능한 슬라이드쇼 생성을 사람의 개입 없이 처리합니다
- 파일 검색 및 처리 — Google Drive에서 파일을 가져와 처리하고, 원시 데이터에서 포맷된 프레젠테이션을 만드는 과정이 시연되었습니다

가격 및 가용성: Pro 400건, Plus 40건
출시는 OpenAI의 단계적 접근 모델을 따릅니다:
- Pro 구독자 (월 $200) — 월 400건의 에이전트 메시지, 출시일 즉시 접근
- Plus 구독자 (월 $20) — 월 40건의 에이전트 메시지, 출시 후 순차 배포
- Team 구독자 — 월 40건의 에이전트 메시지, Plus와 동일한 배포 일정
- Enterprise 및 Education — 출시 후 수 주 내 접근 예정
유연한 크레딧 시스템을 통해 추가 에이전트 메시지 용량을 구매할 수 있습니다. Plus 플랜의 월 40건은 하루 1-2개 에이전트 작업에 해당하는 수준으로, 간헐적 파워 유저에게는 충분하지만 매일 사용하려면 Pro의 400건이 훨씬 실용적입니다.
경쟁 구도: ChatGPT Agent의 위치
OpenAI가 혼자 달리는 것은 아닙니다. Google의 Gemini 2.5는 2025년 3월부터 LMArena 리더보드를 장악하고 있으며, 멀티모달 퍼스트 접근과 100만 토큰 컨텍스트 윈도우를 제공합니다. Anthropic의 Claude는 20만 토큰 윈도우와 뛰어난 검색 정확도로 장문 분석 영역을 확보했습니다. Microsoft Copilot은 Office 365 통합을 활용한 엔터프라이즈 워크플로우에서 강세를 보입니다.
ChatGPT Agent의 차별점은 액션 레이어입니다. Gemini와 Claude가 분석과 생성에 탁월한 반면, ChatGPT Agent는 실제로 현실 세계에서 행동할 수 있습니다 — 웹사이트를 탐색하고, 버튼을 클릭하고, 양식을 작성하며, 이전에는 사람이 키보드를 직접 조작해야 했던 다단계 워크플로우를 자동화합니다. 이것이 에이전틱 AI 경쟁에서 OpenAI를 앞서게 하는 근본적 차이점입니다.
하지만 우려도 있습니다. 보안이 핵심 이슈입니다. 에이전트가 웹사이트를 탐색해야 하므로 악성 사이트, 피싱 시도, 웹 콘텐츠에 내장된 프롬프트 인젝션 공격에 노출될 수 있습니다. OpenAI는 이를 인정하며 “점진적으로 완화될 경고와 함께 강력한 경보 시스템”을 계획하고 있다고 밝혔습니다. 민감한 데이터를 다루는 엔터프라이즈 고객에게는 보안 모델이 프로덕션에서 검증될 때까지 도입이 어려울 수 있습니다.
개발자와 파워 유저에게 의미하는 것
개발자에게 ChatGPT Agent는 기회이자 변혁입니다. 터미널을 통한 코드 실행, Connectors를 통한 GitHub 리포지토리 상호작용, 별도 도구가 필요했던 개발 워크플로우 자동화가 가능합니다. AI 기반 애플리케이션을 구축 중이라면, 브라우징-코딩-분석을 일관된 워크플로우로 연결하는 에이전트의 능력이 프로토타이핑 사이클을 크게 단축할 수 있습니다.
크리에이티브 및 비즈니스 분야의 파워 유저에게도 영향은 동일합니다. 수십 개 웹사이트에서 주제를 조사하고, 구조화된 보고서로 정리하고, 시각적 프레젠테이션을 생성하며, 구매 업무까지 처리할 수 있습니다 — 모두 자연어 지시만으로. 복잡한 다단계 자동화의 진입 장벽이 “개발자가 필요합니다”에서 “프롬프트가 필요합니다”로 낮아졌습니다.
더 큰 그림: 어시스턴트에서 자율 에이전트로
ChatGPT Agent는 AI와의 상호작용 방식에 근본적 전환을 알립니다. 대화형 챗봇 시대가 에이전틱 시대로 넘어가고 있습니다 — AI가 단순히 정보를 제공하는 것이 아니라 직접 행동하는 시대. OpenAI는 명확한 선을 그었습니다: ChatGPT의 미래는 더 나은 텍스트 생성이 아니라, 더 나은 작업 실행입니다.
400/40건의 메시지 제한은 OpenAI가 컴퓨트 비용과 대규모 안전성에 신중하게 접근하고 있음을 보여줍니다. 인프라가 확장되고 안전 시스템이 성숙해지면 이 제한은 높아질 것입니다. 하지만 현재 수준에서도, 웹 브라우징과 코드 실행, 실제 행동이 가능한 AI를 갖는다는 것은 모든 전문가가 주목해야 할 패러다임 전환입니다.
개발자로서 워크플로우를 자동화하든, 비즈니스 애널리스트로서 경쟁 정보를 수집하든, 크리에이티브 프로페셔널로서 리서치와 프로덕션을 병행하든 — ChatGPT Agent는 최초 출시 이후 ChatGPT에 대한 가장 의미 있는 업그레이드입니다. 에이전틱 AI가 우리의 업무 방식을 바꿀지는 더 이상 질문이 아닙니다 — 얼마나 빨리 여러분의 워크플로우를 적용할 것인가가 관건입니다.
AI 기반 자동화 파이프라인 구축이나 에이전틱 AI 비즈니스 통합에 관심이 있으시다면, Sean Kim이 프로덕션 환경에서 AI 시스템을 설계해 온 경험을 공유합니다.
매주 AI, 음악, 테크 트렌드를 이메일로 받아보세요.



