Hermes Agent Self-Evolution — 에이전트 자가 진화

DSPy + GEPA(Genetic-Pareto Prompt Evolution)로 의 스킬·프롬프트·코드를 자동 진화·최적화. GPU 훈련 불필요. ~$2-10/회.

개요

NousResearch/hermes-agent-self-evolution은 Hermes Agent의 구성 요소를 진화적 방법으로 자동 개선하는 도구다. ICLR 2026 Oral 논문인 GEPA를 활용하여, 실행 트레이스를 읽고 실패했는지 이해한 뒤 타겟팅된 개선안을 제안한다.

  • 스타: 1,425
  • 포크: 125
  • 생성: 2026-03-09
  • 최근 업데이트: 2026-04-13
  • 라이선스: MIT
  • 비용: ~$2-10 per optimization run (API 호출만, GPU 불필요)

작동 원리

현재 스킬/프롬프트/도구 읽기 ──► 평가 데이터셋 생성
                                        │
                                        ▼
                                   GEPA Optimizer ◄── 실행 트레이스
                                        │                    ▲
                                        ▼                    │
                                   후보 변형(variants) ──► 평가
                                        │
                                   제약 게이트 (테스트, 크기 제한, 벤치마크)
                                        │
                                        ▼
                                   최적 변형 ──► hermes-agent에 PR

진화 단계

단계대상엔진상태
Phase 1스킬 파일 (SKILL.md)DSPy + GEPA✅ 구현 완료
Phase 2도구 설명DSPy + GEPA🔲 계획
Phase 3시스템 프롬프트 섹션DSPy + GEPA🔲 계획
Phase 4도구 구현 코드Darwinian Evolver🔲 계획
Phase 5지속적 개선 루프자동화 파이프라인🔲 계획

핵심 엔진

엔진역할라이선스
DSPy + GEPA반성적 프롬프트 진화 — 실행 트레이스를 읽고 타겟팅된 변이 제안MIT
Darwinian EvolverGit 기반 생명체 모델로 코드 진화AGPL v3 (외부 CLI만)

가드레일

  1. 전체 테스트 스위트 통과 — pytest 100% 패스 필수
  2. 크기 제한 — 스킬 ≤15KB, 도구 설명 ≤500자
  3. 캐싱 호환성 — 대화 중 변경 금지
  4. 의미 보존 — 원래 목적에서 이탈 금지
  5. PR 리뷰 — 모든 변경은 사람 리뷰 거침 (직접 커밋 금지)

의미

  • 에이전트 자가 개선: 에이전트가 자신의 프롬프트/스킬을 스스로 최적화하는 메타 학습 패러다임
  • 저비용: GPU 없이 API 호출만으로 $2-10에 최적화 수행
  • 생태계 확장: 에이전트 아키텍처의 진화 방향과 맞닿아 있음