Meta HyperAgents: 에이전트가 스스로 하네스를 설계할 때
Meta와 UBC가 공동 발표한 HyperAgents는 에이전트가 작업 수행 코드뿐 아니라 개선 메커니즘 자체까지 스스로 수정하는 자기참조적 AI 에이전트 프레임워크다. 에이전트가 인프라의 소비자에서 생산자로 전환하는 패러다임 전환을 시사한다.
핵심 개념
- Hyperagent = 인프라의 생산자(producer). 최소 상태에서 시작해 자기참조적 진화를 통해 스스로 프로덕션 수준의 하네스를 부트스트랩
- Universal Agent vs Hyperagent: Universal Agent는 뛰어난 실행자(executor)지만 인간이 설계한 하네스 안에서 동작. Hyperagent는 인프라를 스스로 생산
작동 방식
Hyperagent는 두 가지를 포함하는 단일 편집 가능 프로그램:
- Task Agent: 주어진 작업을 해결
- Meta Agent: Task Agent와 자기 자신을 수정
진화 루프:
- 기본 에이전트에서 시작
- Meta Agent가 에이전트 코드를 읽고 과거 성능을 분석하여 수정 버전 생성
- 수정 버전 평가, 성능이 더 좋으면 아카이브에 추가
- 아카이브에서 선택 후 반복
프로덕션 하네스의 6가지 핵심 구성요소
| 구성요소 | 설명 |
|---|---|
| Tool Integration | 도구 등록 및 실행 |
| Memory & State | 단계 간 결과 영속화 |
| Context Engineering | 동적 프롬프트 조립 |
| Planning | 복잡한 작업을 단계로 분해 |
| Verification | 규칙 대비 출력 검증 |
| Modularity | 구성요소 독립적 토글 |
자기 개선으로 출현한 구성요소
수백 회 반복을 거치며 에이전트가 독립적으로 발명한 요소들:
영속 메모리 (Persistent Memory)
- 개발자 지시 없이 스스로 메모리 시스템 진화
- 과거 결과 기억, 성능 추세 추적, 종합된 인사이트 저장
- 예: 인과 가설 저장, 최고 성능 세대 식별, 과잉 수정 진단
성능 추적 (Performance Tracking)
- 자체 관측 가능성(observability) 구축
- 이동 평균, 세대별 종합 통계, 도메인별 점수 이력 포함
- 개발자가 수작업으로 구축하는 토큰 추적·감사 로깅과 동일
다단계 평가 파이프라인 (Multi-stage Evaluation)
- 피상적 지시에서 명시적 다단계 평가로 진화
- 체크리스트, 의사결정 규칙, 명확한 기준 포함
- 에이전트가 자체적으로 검증기(verifier) 구축
임계값 기반 의사결정 프로토콜
- 수락/거부 비율, 점수 임계값, 신뢰도 수준 등 명시적 의사결정 경계
도메인 지식 베이스
- 환경 제약 조건, 유효 상태 변수, 보상 스케일링 휴리스틱 등 점진적 구축
- 에이전트가 자신을 위해 올바른 컨텍스트를 조립하는 컨텍스트 엔지니어링의 결과
재시도 및 자기 교정
- 수정이 성능을 악화시킨 경우 후속 세대가 회귀를 진단하고 교정
- 하네스의 피드백 주입 포함 재시도 루프와 동일 패턴
의의
- 수렴적 아키텍처: 에이전트가 스스로 구축한 구성요소가 개발자가 수작업으로 만들던 프로덕션 하네스와 정확히 일치
- 역할 변화: 개발자의 역할은 하네스를 직접 구축하는 것에서, 에이전트가 효과적인 하네스를 진화시킬 수 있는 초기 조건을 설계하는 방향으로 변화
- 4단계 수렴 흐름: Harness Engineering → From Copilot to Codex → Universal Agents → HyperAgents
관련 노트
- harness — 에이전트 하네스 엔티티 페이지
- 2026-03-24-anthropic-harness-design — Anthropic 하네스 설계 가이드
- 2026-03-29-anthropic-harness-design-experiment — 하네스 설계 실험 (200)
- moc-ai-agents-harness — 하네스 & 자가개선 MOC