Hermes Agent Self-Evolution — 에이전트 자가 진화
DSPy + GEPA(Genetic-Pareto Prompt Evolution)로 의 스킬·프롬프트·코드를 자동 진화·최적화. GPU 훈련 불필요. ~$2-10/회.
개요
NousResearch/hermes-agent-self-evolution은 Hermes Agent의 구성 요소를 진화적 방법으로 자동 개선하는 도구다. ICLR 2026 Oral 논문인 GEPA를 활용하여, 실행 트레이스를 읽고 왜 실패했는지 이해한 뒤 타겟팅된 개선안을 제안한다.
- 스타: 1,425
- 포크: 125
- 생성: 2026-03-09
- 최근 업데이트: 2026-04-13
- 라이선스: MIT
- 비용: ~$2-10 per optimization run (API 호출만, GPU 불필요)
작동 원리
현재 스킬/프롬프트/도구 읽기 ──► 평가 데이터셋 생성
│
▼
GEPA Optimizer ◄── 실행 트레이스
│ ▲
▼ │
후보 변형(variants) ──► 평가
│
제약 게이트 (테스트, 크기 제한, 벤치마크)
│
▼
최적 변형 ──► hermes-agent에 PR
진화 단계
| 단계 | 대상 | 엔진 | 상태 |
|---|---|---|---|
| Phase 1 | 스킬 파일 (SKILL.md) | DSPy + GEPA | ✅ 구현 완료 |
| Phase 2 | 도구 설명 | DSPy + GEPA | 🔲 계획 |
| Phase 3 | 시스템 프롬프트 섹션 | DSPy + GEPA | 🔲 계획 |
| Phase 4 | 도구 구현 코드 | Darwinian Evolver | 🔲 계획 |
| Phase 5 | 지속적 개선 루프 | 자동화 파이프라인 | 🔲 계획 |
핵심 엔진
| 엔진 | 역할 | 라이선스 |
|---|---|---|
| DSPy + GEPA | 반성적 프롬프트 진화 — 실행 트레이스를 읽고 타겟팅된 변이 제안 | MIT |
| Darwinian Evolver | Git 기반 생명체 모델로 코드 진화 | AGPL v3 (외부 CLI만) |
가드레일
- 전체 테스트 스위트 통과 — pytest 100% 패스 필수
- 크기 제한 — 스킬 ≤15KB, 도구 설명 ≤500자
- 캐싱 호환성 — 대화 중 변경 금지
- 의미 보존 — 원래 목적에서 이탈 금지
- PR 리뷰 — 모든 변경은 사람 리뷰 거침 (직접 커밋 금지)
의미
- 에이전트 자가 개선: 에이전트가 자신의 프롬프트/스킬을 스스로 최적화하는 메타 학습 패러다임
- 저비용: GPU 없이 API 호출만으로 $2-10에 최적화 수행
- 생태계 확장: 에이전트 아키텍처의 진화 방향과 맞닿아 있음
Related Notes
- — Hermes Agent 엔티티
- 2026-04-13-claude-code-ultraplan — Claude Code /ultraplan (지능형 계획)
- moc-ai-agents — AI 에이전트 MOC
- moc-ai-coding — AI 코딩 도구 MOC