ETCLOVG · G — Governance & Security (거버넌스 · 보안)

에이전트가 무엇을 해도 되는지를 정하고 추적하는 계층. permission model, hooks, constitutions, audit, security policy, human approval.

상위 노트: 2026-05-24-agent-harness-engineering-survey · MOC: moc-ai-agents-harness

정의 (Scope)

Governance & security.

서베이의 1차 프로젝트 수: 14개. ETCLOVG가 기존 6-component framework에서 승격시킨 두 번째 계층 (Observability와 함께).

서베이의 명시적 관찰: 오픈소스에는 얇음. 상용 플랫폼·SDK feature·엔지니어링 글에 더 많이 산다.

핵심 관심사 (Key Concerns)

관심사내용
permission model도구/리소스별 사전 허가, 동적 escalation
hookspre/post action에서 정책 평가, 가드레일 주입
constitutions에이전트의 행동 원칙·금지 사항 명문화
identity에이전트가 누구로(whose authority) 행동하는가 — service account vs delegated user
audit모든 결정·승인의 추적, 사후 책임 추적 가능성
human approval위험·비용 임계 시 사람 결재 (classifier-backed approval delegation)
risk-aware autonomy”auto mode” — 자동 결재 vs 명시 결재의 분기 정책

Capability–Control 축은 G의 핵심

from §5.2

더 큰 도구 메뉴, 영속 메모리, 관대한 샌드박스 = 능력↑, blast radius↑. 거버넌스는 다음을 관통하는 단일 설계 축:

  • tool schemas (T)
  • context policy (C)
  • runtime permissions (E)
  • identity (G)
  • auditability (G + O)
  • human approval (G + L)

→ G는 다른 모든 레이어에 교차한다.

대표 오픈소스 (Awesome-Agent-Harness · Guardrails, Security & Governance)

  • OpenShell (NVIDIA) — 선언형 fs/network/process/inference 정책
  • stakpak/agent — 자율 ops 루프 + 감사 가능성
  • Anthropic — Claude Code auto mode: classifier-backed approval delegation을 안전한 고자율(high-autonomy) 코딩 런에 적용 — 블로그 글 + SDK feature
  • Anthropic — Managed Agents: 세션 로그 · 하네스 루프 · 샌드박스를 decouple해 거버넌스를 인프라 차원에서 분리

우리 vault 연결 노트

  • “Claude Code auto mode” (Anthropic)
  • “Scaling Managed Agents” (Anthropic)
  • “Building Effective AI Agents” (Anthropic)
  • “Your Agent Needs a Harness, Not a Framework” (Inngest)

열린 문제 연결

  • Open Problem 1 — execution hardening 평가 표준은 G의 평가 기준을 제공
  • Open Problem 4 — standard handoffs는 권한·신뢰 이양 프로토콜 = G의 핵심

다음 레이어

etclovg-v-verification · 7계층 사이클 완성 → 2026-05-24-agent-harness-engineering-survey