한 줄 요약
에이전트가 매일 밤 자동으로 리서치 → 복기 → 판단 → 적용하는 “Dream Cycle”을 돌리면, 자기 자신을 개선하는 루프가 완성된다.
Dream Cycle 구조
매일 밤 11시에 실행:
- 스캔 — arXiv/GitHub에서 새 AI 논문 스캔
- 복기 — 오늘 에이전트 성과 복기
- 리서치 — 관련 논문 깊이 파기
- 판단 — 운영 방식 변경 여부 결정
안전하면 스테이징. 새벽 4시 크론이 빌드. 아침에 변경 로그가 도착.
핵심 반전
이 루프가 “반복 깊이 탐색” 논문을 발견해서, Dream Cycle 자체를 업그레이드함. → 에이전트가 자기 자신의 개선 루프를 개선한 것.
비용: 밤당 12)
모델 라우팅이 핵심:
| 단계 | 모델 | 이유 |
|---|---|---|
| 스캔 | Haiku (저렴) | 대량 필터링, 정확도 덜 중요 |
| 판단 | Opus (고성능) | 변경 여부는 정확도 필수 |
OpenClaw에서의 구현
이 구조를 그대로 따라할 수 있음:
# cron 설정 예시
- 매일 23:00 → Dream Cycle 스킬 실행 (Haiku로 스캔)
- 매일 04:00 → 스테이징된 변경사항 빌드
- 아침 → 변경 로그 알림
OpenClaw 조합: cron + skills + model routing
왜 이게 가능한가
- 자가 개선 루프 — 사람이 프롬프트를 고치는 게 아니라, 연구 → 판단 → 적용이 전부 자동
- 안전장치 — 바로 적용이 아니라 스테이징 + 별도 빌드 크론으로 분리
- 비용 효율 — 모델 라우팅으로 비용을 월 $12 수준으로 유지
연결된 생각
- 2026-03-29-memento-skills — 스킬 라이브러리 자가 진화와 같은 맥락
- 2026-03-23-trading-agents-hedge-fund-simulation — 트레이딩 에이전트에 야간 개선 루프 적용 가능
- 2026-03-22-openjarvis — 로컬 에이전트의 자가 개선 아키텍처
- 2026-03-23-karpathy-coding-end-insights — 에이전트가 스스로를 개선하는 시대의 도래
- 2026-03-29-sourceloop — 야간 리서치 루프의 스캔 단계에 NotebookLM 기반 리서치 활용 가능
- 2026-03-29-agent-eval-checklist — Dream Cycle이 변경을 적용하기 전 eval 체크리스트로 안전장치 강화 가능
- 2026-03-29-minimax-glm-kimi-coding-comparison — Dream Cycle의 모델 라우팅 전략 설계에 참고 (m2.7 스캔, GLM-5.1 판단)
- 2026-03-29-opencode-kiro-integration — Kiro로 Claude 모델 무료 사용 + Dream Cycle에 적용 가능