Computer Use Agent Landscape
이 페이지는 데스크톱/OS 레벨 computer use 에이전트 지형도를 모아두는 참조 노트다. 화면을 점거하는 전통적 접근, 백그라운드-safe 실행, OS 네이티브 자동화, 격리 샌드박스, 제품화된 데스크톱 에이전트가 서로 다른 축으로 발전하고 있다.
읽는 법
이 지형도는 단순히 “누가 더 강한가”를 비교하는 표가 아니다. 핵심은 어떤 실행 경계(boundary)를 제공하는가, 사용자의 foreground 작업을 얼마나 보존하는가, 에이전트와 OS 사이에 어떤 운영면을 노출하는가다.
즉,
- **격리(隔離)**를 원하면 2026-04-28-trycua-cua-ai-agent-os-sandbox
- 백그라운드-safe 조작을 원하면 2026-05-06-trope-cua
- 제품으로 다듬어진 데스크톱 경험을 원하면 2026-04-10-factory-droid-desktop-app
- 벤더 기본 기능을 보려면 2026-03-25-claude-code-computer-use
대표 프로젝트 비교
| 프로젝트 | 플랫폼 | 경계 모델 | 제어 방식 | 강점 | 주의점 |
|---|---|---|---|---|---|
| 2026-04-28-trycua-cua-ai-agent-os-sandbox | macOS 중심 | 격리 VM | Lume VM + CUI + CUA | 거의 네이티브 속도에 가까운 격리, 전체 OS 제어 | VM/샌드박스 운영 복잡도 |
| 2026-05-06-trope-cua | Windows / macOS | background-safe driver | MCP / daemon / CLI | receipts, trajectory, cursor/foreground 보존 명시 | 모든 앱이 안전 경로를 제공하진 않음 |
| 2026-03-25-claude-code-computer-use | Claude Code 생태계 | vendor-native | 내장 Computer Use | 사용자 입장에서 바로 쓰기 쉬움, 안전장치 내장 | 벤더 정책/제품 경로에 의존 |
| 2026-04-10-factory-droid-desktop-app | macOS / Windows | 제품화된 데스크톱 앱 | CLI + 데스크톱 앱 + 멀티 세션 | 협업/세션 지속성/시각화/UI 통합 | 완전한 오픈 저널보다 제품 성격이 강함 |
| 2026-04-27-macos-cua-repos-comparison | macOS | 오픈소스 CUA 실험장 | Swift / Python / MCP | macOS에서의 다양한 자동화 접근을 한 번에 비교 | 개별 repo 성숙도 차이가 큼 |
주요 축
1) 백그라운드-safe CUA 드라이버
- 2026-05-06-trope-cua — Windows/macOS용 background-safe receipt 기반 드라이버
- 2026-04-27-macos-cua-repos-comparison — macOS CUA 생태계 비교
2) OS 레벨 샌드박스 / 격리 실행
- 2026-04-28-trycua-cua-ai-agent-os-sandbox — 네이티브 속도에 가까운 격리 실행 계층
3) vendor-native computer use
- 2026-03-25-claude-code-computer-use — Claude Code의 Computer Use 기능
4) 제품화된 desktop agent
- 2026-04-10-factory-droid-desktop-app — Factory의 데스크톱 에이전트 제품
비교 축별 해석
1. 격리 vs 직접 제어
- trycua/cua는 “에이전트에게 별도 컴퓨터를 준다”는 쪽에 가깝다.
- Trope CUA는 “실제 컴퓨터를 건드리되, foreground를 보존한다”는 쪽에 가깝다.
- Claude Code Computer Use는 벤더가 기본 제공하는 직접 제어 경로다.
2. 운영면의 가시성
- Trope CUA의 receipts와 trajectory는 에이전트의 행동 결과를 추적하기 쉽게 만든다.
- Factory Droid는 세션·히스토리·렌더링을 제품 레벨로 묶는다.
- trycua/cua는 VM 레이어를 통해 실패를 쉽게 버리고 새로 시작하는 운영 모델을 제공한다.
3. 사용자 작업 보존
- foreground 작업을 보호하는 쪽은 Trope CUA
- 사용자에게 독립 환경을 주는 쪽은 trycua/cua
- 앱 전체를 제품 안에 끌어오는 쪽은 Factory Droid
해석
- 프롬프트/모델의 문제만이 아니다: 실제로는 권한, 포커스, 창 관리, 프로필 격리, 앱별 안전 경로가 성능을 좌우한다.
- background-safe가 중요해진다: 사용자의 foreground 작업을 보호할 수 있는지 여부가 경쟁력의 핵심이 된다.
- MCP/CLI/daemon 조합이 일반화: 에이전트와 데스크톱 제어 계층을 분리해 재사용 가능한 운영면을 만든다.