Memento-Skills — Let Agents Design Agents

한 줄 요약

동결된 LLM의 파라미터를 수정하지 않고, 외부 “스킬 라이브러리”를 진화시키며 에이전트가 스스로 학습하는 프레임워크.

LLM은 배포 후 파라미터가 고정(frozen)되면 경험에서 학습하지 못한다. Memento-Skills는 스킬이라는 단위로 외부 메모리를 구성하고, 실행 결과를 기반으로 스킬을 자동 생성/수정/폐기하는 Read-Write 반영 학습 메커니즘을 제안한다.

“에이전트를 설계하는 에이전트” — 사람이 매 작업마다 프롬프트를 설계할 필요 없이, 에이전트가 경험을 통해 스스로 작업별 스킬을 축적한다.

실행 결과를 보고:

벤치마크	Memento-Skills	베이스라인 (Read-Write ablation)	향상폭
GAIA	66.0%	52.3%	+13.7%p
HLE	38.7%	17.9%	+20.8%p

과목	R0 (시작)	R3 (학습 후)
인문학	-	66.7%
생물학	-	60.7%

HLE의 구조화된 과목 분류 덕분에 같은 도메인 내 스킬 전이가 활발하게 일어남.

Dream Cycle — 야간 자기 개선 루프, 스킬 진화와 같은 맥락의 “에이전트 자가 진화” 패턴
2026 03 23 Trading Agents Hedge Fund Simulation — 멀티 에이전트 트레이딩에 스킬 라이브러리 적용 가능
2026 03 22 Openjarvis — 로컬 에이전트에 스킬 기반 학습 접목 가능
2026 03 29 Sourceloop — NotebookLM 리서치 런타임, 스킬 진화와 함께 지식 수집 자동화
2026 03 29 Agent Eval Checklist — 스킬 변경의 안정성을 보장하는 eval 프레임워크 (Write Phase의 유닛테스트 게이트와 연결)
2026 03 29 Harness Claude Code — 스킬을 자동 생성하는 Claude Code 플러그인, Memento-Skills의 실용적 구현체
2026 03 23 Karpathy Coding End Insights — 에이전트가 코드를 대신 작성하는 시대, 스킬 설계가 핵심 역량
2026 03 22 Anthropic Ai Coding Skills Formation — AI가 인간 스킬 형성에 미치는 영향 vs 에이전트가 스스로 스킬 형성