OpenClaw 에이전트를 위한 사람과 같은 메모리 시스템 연구
OpenClaw 에이전트가 사람처럼 망각되는 메모리를 구현하기 위한 연구 결과
문제 제기
현재 에이전트 메모리의 한계
-
시간적 오염 문제
- Karpathy의 게시글이 2개월 전 정보임에도 불구하고
- 현재 에이전트가 마치 최신 정보처럼 답변하는 경향
-
맥락 없는 질문 반복
- “어떤 일을 하고 있었죠?” 같은 맥락 없는 질문에도
- 이전 세션 내용을 기억 못하고 물어보는 경우가 너무 많음
결론
에이전트의 답변 퀄리티를 저하시키거나 컨텍스트를 낭비하게 만듦
해결 방안: 사람의 뇌 메모리 모델링
핵심 원칙
사람의 뇌처럼 retrieve 되지 않는 기억을 점진적 퇴화시켜야 한다
메모리 퇴화 규칙
| 기억 유형 | 저장 기간 | 퇴화 속도 |
|---|---|---|
| Fact (사실) | 오래 저장됨 | 느리게 사라짐 |
| Episode (일상대화) | 빠르게 사라짐 | 빠르게 사라짐 |
| 높은 중요도 | 천천히 잊혀짐 | 느리게 퇴화 |
| 낮은 중요도 | 빨리 잊혀짐 | 빠르게 퇴화 |
수학적 모델링
최적화 기준
- LongMemEval Benchmark 기준으로 최적화 진행
- 81% 정확도 달성
벤치마크 성적
| 벤치마크 | 성적 |
|---|---|
| LongMemEval | 81% 정확도 |
| LoCoMo | 준수한 성적 기록 |
| 다른 벤치마크 | 일관된 성적 달성 |
목표
수학적으로 모델링하여 기억이 어떻게 사라지는지 예측 가능하게 디자인
연관성 강화: Association Boosting
핵심 아이디어
“충주 사과가 맛있네”와 같이 연관된 기억이 boost 점수를 얻어 강화
작동 방식
-
기존 기억 생성
기억: "충주 사과가 맛있네" 중요도: 기본값 -
연관 기억 접근 시 Boosting
질문: "충주 시에 충주 사과가 맛있었지?" → 기존 "충주 사과가 맛있네" 기억을 검색 → 연관성으로 인식 → Boost 점수 적용 → 기억 강화
효과
- 연관된 기억 접근 시 강화
- 자연스러운 대화 흐름 (사람처럼 맥락 이어짐)
- 맥락 없는 질문 감소 (연관된 기억이 자동 트리거됨)
구현 고려사항
기억 저장소 구조
class Memory:
id: str
content: str
importance: float # 0.0 ~ 1.0
created_at: datetime
last_accessed_at: datetime
access_count: int
type: Enum # Fact, Episode
def decay_score(self) -> float:
"""시간과 중요도에 따른 퇴화 점수 계산"""
age_days = (now - self.last_accessed_at).days
base_decay = exp(-0.1 * age_days) # 기하급 퇴화
importance_factor = self.importance
return base_decay * importance_factor
def access(self):
"""기억 접근 시 업데이트"""
self.last_accessed_at = now()
self.access_count += 1
# 연관 기억 boosting 검색 후 수행검색 알고리즘
def retrieve_memories(query: str, top_k: int = 10) -> List[Memory]:
"""
1. 임베딩 기반 유사도 검색
2. decay_score로 정렬
3. 연관 기억 boosting 점수 계산
4. 최종 스코어 = 유사도 * decay_score * boost_score
5. top_k 반환
"""적용 대상
OpenClaw
- 메모리 백엔드: https://lnkd.in/gKDEz_CV
- OpenClaw용 어댑터: https://lnkd.in/g_YgU9Tg
Claude Code
- Claude Code용 어댑터: https://lnkd.in/gk2yJe7t
핵심 통찰
-
퇴화가 필수
- 오래된 정보가 최신 정보처럼 답변되는 것 방지
- 컨텍스트 낭비 방지
- 답변 퀄리티 유지
-
연관성이 핵심
- 사람의 뇌는 고립된 기억이 아닌 연결된 네트워크
- Association Boosting이 이를 모델링
-
수학적 예측 가능성
- 어떤 기억이 언제 사라지는지 예측
- 기억 관리 시스템 설계 가능
연구 제한사항
- 현재 백엔드 구현에서 테스트 안 됨
- 정확한 벤치마크 데이터셋 필요
- 실제 OpenClaw/Claude Code 환경에서 검증 필요
관련 자료
- LongMemEval Benchmark: [링크 필요]
- LoCoMo: [링크 필요]
- LinkedIn 게시글: 원본
Added: 2026-03-31