Hermes Agent Self-Evolution — DSPy + GEPA로 스킬 자동 최적화
DSPy + GEPA(Genetic-Pareto Prompt Evolution)를 사용한 Hermes Agent의 스킬/프롬프트/도구 설명 자동 진화 최적화. GPU訓練不要, API 호출만으로 ~$2-10/run
Overview
Hermes Agent Self-Evolution은 실행 트레이스(실행 기록)를 읽어 왜 실패했는지를 분석한 뒤, 표면적 실패가 아닌 근본 원인을 타겟팅하여 개선안을 제안하는 진화적 자기개선 프레임워크다. 이런 류의 스킬/프롬프트 진화는 Agent Skills처럼 구조화된 워크플로우를 갖춘 레포와 특히 잘 맞는다.
ICLR 2026 Oral, MIT 라이선스.
How It Works
Read current skill/prompt/tool ──► Generate eval dataset
│
▼
GEPA Optimizer ◄── Execution traces
│ ▲
▼ │
Candidate variants ──► Evaluate
│
Constraint gates (tests, size limits, benchmarks)
│
▼
Best variant ──► PR against hermes-agent
최적화 단계 (Roadmap)
| 단계 | 타겟 | 엔진 | 상태 |
|---|---|---|---|
| Phase 1 | Skill 파일 (SKILL.md) | DSPy + GEPA | ✅ 구현 완료 |
| Phase 2 | Tool 설명 | DSPy + GEPA | 🔲 계획 |
| Phase 3 | System Prompt 섹션 | DSPy + GEPA | 🔲 계획 |
| Phase 4 | Tool 구현 코드 | Darwinian Evolver | 🔲 계획 |
| Phase 5 | 지속적 개선 루프 | 자동화 파이프라인 | 🔲 계획 |
엔진
| 엔진 | 역할 | 라이선스 |
|---|---|---|
| DSPy + GEPA | 실행 트레이스 분석 → 표면적 실패가 아닌 근본 원인 타겟팅 → 개선안 제안 | MIT |
| Darwinian Evolver | Git 기반 organisms를 통한 코드 진화 | AGPL v3 (external CLI only) |
Guardrails
모든 진화 변형은 다음을 통과해야 함:
- 테스트 스위트 통과 —
pytest tests/ -q100% 통과 - 사이즈 제한 — Skills ≤15KB, tool description ≤500 chars
- 캐싱 호환 — 대화 중 변경 불가
- 의미 보존 — 원래 목적에서drift 금지
- PR 리뷰 — 모든 변경은 인간 리뷰 경유, 직접 커밋 불가
Quick Start
# 설치
git clone https://github.com/NousResearch/hermes-agent-self-evolution.git
cd hermes-agent-self-evolution
pip install -e ".[dev]"
# hermes-agent repo 지정
export HERMES_AGENT_REPO=~/.hermes/hermes-agent
# Synthetic eval data로 스킬 진화
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source synthetic
# 실제 세션 히스토리 활용 (Claude Code, Copilot, Hermes)
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source sessiondbRelated Notes
- moc-ai-agents-harness — 하네스 설계 & 자가개선 관련 MOC
- hermes-agent — Hermes Agent 관련 MOC
Source
- GitHub: https://github.com/NousResearch/hermes-agent-self-evolution
- Stars: 2,244 | Forks: 235 | License: MIT
- Contributors: 2 (teknium1, tjp2021)
- Created: 2026-03-09 | Last push: 2026-03-29