Computer Use Agent Landscape

이 페이지는 데스크톱/OS 레벨 computer use 에이전트 지형도를 모아두는 참조 노트다. 화면을 점거하는 전통적 접근, 백그라운드-safe 실행, OS 네이티브 자동화, 격리 샌드박스, 제품화된 데스크톱 에이전트가 서로 다른 축으로 발전하고 있다.

읽는 법

이 지형도는 단순히 “누가 더 강한가”를 비교하는 표가 아니다. 핵심은 어떤 실행 경계(boundary)를 제공하는가, 사용자의 foreground 작업을 얼마나 보존하는가, 에이전트와 OS 사이에 어떤 운영면을 노출하는가다.

즉,

**격리(隔離)**를 원하면 2026-04-28-trycua-cua-ai-agent-os-sandbox
백그라운드-safe 조작을 원하면 2026-05-06-trope-cua
제품으로 다듬어진 데스크톱 경험을 원하면 2026-04-10-factory-droid-desktop-app
벤더 기본 기능을 보려면 2026-03-25-claude-code-computer-use

대표 프로젝트 비교

프로젝트	플랫폼	경계 모델	제어 방식	강점	주의점
2026-04-28-trycua-cua-ai-agent-os-sandbox	macOS 중심	격리 VM	Lume VM + CUI + CUA	거의 네이티브 속도에 가까운 격리, 전체 OS 제어	VM/샌드박스 운영 복잡도
2026-05-06-trope-cua	Windows / macOS	background-safe driver	MCP / daemon / CLI	receipts, trajectory, cursor/foreground 보존 명시	모든 앱이 안전 경로를 제공하진 않음
2026-03-25-claude-code-computer-use	Claude Code 생태계	vendor-native	내장 Computer Use	사용자 입장에서 바로 쓰기 쉬움, 안전장치 내장	벤더 정책/제품 경로에 의존
2026-04-10-factory-droid-desktop-app	macOS / Windows	제품화된 데스크톱 앱	CLI + 데스크톱 앱 + 멀티 세션	협업/세션 지속성/시각화/UI 통합	완전한 오픈 저널보다 제품 성격이 강함
2026-04-27-macos-cua-repos-comparison	macOS	오픈소스 CUA 실험장	Swift / Python / MCP	macOS에서의 다양한 자동화 접근을 한 번에 비교	개별 repo 성숙도 차이가 큼

주요 축

1) 백그라운드-safe CUA 드라이버

2026-05-06-trope-cua — Windows/macOS용 background-safe receipt 기반 드라이버
2026-04-27-macos-cua-repos-comparison — macOS CUA 생태계 비교

2) OS 레벨 샌드박스 / 격리 실행

2026-04-28-trycua-cua-ai-agent-os-sandbox — 네이티브 속도에 가까운 격리 실행 계층

3) vendor-native computer use

2026-03-25-claude-code-computer-use — Claude Code의 Computer Use 기능

4) 제품화된 desktop agent

2026-04-10-factory-droid-desktop-app — Factory의 데스크톱 에이전트 제품

비교 축별 해석

1. 격리 vs 직접 제어

trycua/cua는 “에이전트에게 별도 컴퓨터를 준다”는 쪽에 가깝다.
Trope CUA는 “실제 컴퓨터를 건드리되, foreground를 보존한다”는 쪽에 가깝다.
Claude Code Computer Use는 벤더가 기본 제공하는 직접 제어 경로다.

2. 운영면의 가시성

Trope CUA의 receipts와 trajectory는 에이전트의 행동 결과를 추적하기 쉽게 만든다.
Factory Droid는 세션·히스토리·렌더링을 제품 레벨로 묶는다.
trycua/cua는 VM 레이어를 통해 실패를 쉽게 버리고 새로 시작하는 운영 모델을 제공한다.

3. 사용자 작업 보존

foreground 작업을 보호하는 쪽은 Trope CUA
사용자에게 독립 환경을 주는 쪽은 trycua/cua
앱 전체를 제품 안에 끌어오는 쪽은 Factory Droid

해석

프롬프트/모델의 문제만이 아니다: 실제로는 권한, 포커스, 창 관리, 프로필 격리, 앱별 안전 경로가 성능을 좌우한다.
background-safe가 중요해진다: 사용자의 foreground 작업을 보호할 수 있는지 여부가 경쟁력의 핵심이 된다.
MCP/CLI/daemon 조합이 일반화: 에이전트와 데스크톱 제어 계층을 분리해 재사용 가능한 운영면을 만든다.

LLM Wiki

탐색기

Computer Use Agent Landscape

Computer Use Agent Landscape

읽는 법

대표 프로젝트 비교

주요 축

1) 백그라운드-safe CUA 드라이버

2) OS 레벨 샌드박스 / 격리 실행

3) vendor-native computer use

4) 제품화된 desktop agent

비교 축별 해석

1. 격리 vs 직접 제어

2. 운영면의 가시성

3. 사용자 작업 보존

해석

그래프 뷰

목차

백링크

LLM Wiki

탐색기

Computer Use Agent Landscape

Computer Use Agent Landscape

읽는 법

대표 프로젝트 비교

주요 축

1) 백그라운드-safe CUA 드라이버

2) OS 레벨 샌드박스 / 격리 실행

3) vendor-native computer use

4) 제품화된 desktop agent

비교 축별 해석

1. 격리 vs 직접 제어

2. 운영면의 가시성

3. 사용자 작업 보존

해석

Related

그래프 뷰

목차

백링크