Claude Code 로컬-클라우드 이분법

2026년 4월, Claude Code가 연달아 발표한 4개 기능이 보여주는 하나의 방향성: 지능형 작업은 클라우드로, 환경 상호작용은 로컬로.

테제

Claude Code는 2026년 4월 한 주간 4개의 신기능을 발표했다. 개별적으로 보면 각기 다른 기능이지만, 함께 읽으면 에이전트 작업을 ‘지식 작업’과 ‘실행 작업’으로 분리하여 각각 최적의 환경에 배치하는 아키텍처 전환이라는 하나의 패턴이 드러난다.

4개 기능과 공통 패턴

기능발표일환경작업 유형핵심 통찰
ultraplan4.13클라우드(웹)계획 수립코드를 읽고 의도를 이해하는 건 클라우드에서 가능
동적 루핑4.13로컬스케줄링Claude가 작업 특성에 맞춰 간격을 스스로 결정
Monitor 도구4.13클라우드(백그라운드)모니터링폴링 대신 이벤트 기반. 대규모 토큰 절약
autofix-pr4.13클라우드PR 수정로컬 컨텍스트를 클라우드로 전송, CI/리뷰 자동 처리

핵심 분류: 지식 작업 vs 실행 작업

지식 작업 (Knowledge Work) → 클라우드

코드를 읽고, 이해하고, 계획하고, 판단하는 작업. 파일 시스템·런타임과의 실시간 상호작용이 불필요하다.

  • 계획 수립 (/ultraplan): 아키텍처 결정, 작업 분해, 순서 결정
  • PR 리뷰/수정 (/autofix-pr): CI 로그 읽기, 댓글 해석, 수정 방향 판단
  • 이벤트 감지 (Monitor): 로그 tail, 상태 변화 감지, 의미 판단

이 작업들은 컨텍스트만 있으면 가능하다. 그래서 로컬 세션의 컨텍스트를 클라우드로 전송하는 방식(/autofix-pr)이나, 코드를 읽기만 하면 되는 방식(/ultraplan)이 작동한다.

실행 작업 (Execution Work) → 로컬

파일 시스템·터미널·런타임·브라우저와 실시간으로 상호작용해야 하는 작업.

  • 파일 생성/편집
  • 셸 명령 실행 (빌드, 테스트, 배포)
  • Computer Use (화면 제어)
  • MCP 서버와의 양방향 통신

이 작업은 환경에 대한 직접 접근이 필수적이므로 로컬에서 수행된다.

아키텍처 패턴: Context Ferrying

이 분류가 가능한 핵심 메커니즘은 **컨텍스트 페리(Context Ferrying)**다.

┌─────────────┐    컨텍스트 전송    ┌─────────────┐
│    로컬      │ ──────────────────→ │   클라우드    │
│  (실행 환경) │ ←────────────────── │  (지식 환경) │
│             │    결과/계획 수령     │             │
│  파일·셸    │                      │  분석·계획   │
│  런타임     │                      │  판단·수정   │
│  git        │                      │  모니터링    │
└─────────────┘                      └─────────────┘

/autofix-pr이 이 패턴의 가장 명확한 예다:

  1. 로컬에서 PR 작업 (실행)
  2. /autofix-pr 실행 → 세션 컨텍스트가 클라우드로 전송 (페리)
  3. 클라우드에서 CI 실패 분석 + 수정 (지식 작업)
  4. 수정 커밋이 PR에 반영 (결과 수령)

Monitor 도구는 역방향 페리다:

  1. 클라우드의 백그라운드 스크립트가 이벤트 감지 (지식 작업)
  2. 조건 충족 시 로컬 에이전트를 깨움 (페리)
  3. 로컬 에이전트가 후속 작업 수행 (실행)

왜 지금 이 분리가 가능한가

  1. 컨텍스트 전송 비용 감소: 세션 전체를 클라우드로 보내는 것이 실용적이 됨
  2. 모델 능력 향상: 코드를 읽기만 해도 정확한 판단이 가능해짐
  3. 에이전트 루프 성숙: 실행-판단-수정 사이클이 안정화되어 각 단계를 독립 환경에서 수행 가능

시사점

단기

  • 토큰 비용 최적화: 폴링(Monitor)과 실행 분리(/ultraplan)로 불필요한 토큰 소비 감소
  • 개발자 워크플로우 변화: PR 올리고 나서 기다릴 필요 없이 /autofix-pr 한 방
  • 로컬 리소스 절약: 계획·분석 작업을 클라우드로 오프로드

장기

  • 에이전트 OS 부상: 로컬(실행)과 클라우드(지식)가 분리된 2-tier 에이전트 아키텍처가 표준이 될 가능성
  • 경쟁사 압력: Cursor, Windsurf, Codex 등도 유사한 분리를 따를 것
  • 새로운 최적화 지점: 어떤 작업을 어디서 수행할지 결정하는 라우팅 intelligence가 차별화 포인트

한계 및 열린 질문

  • 보안: 세션 컨텍스트 전체를 클라우드로 보내는 것의 보안 영향은?
  • 컨텍스트 손실: 페리 과정에서 맥락이 손실될 가능성은?
  • 복잡한 작업: 실행과 지식이 뒤섞인 복합 작업은 어떻게 처리?
  • 비용 모델: 클라우드 작업의 과금 구조는?