OpenClaw 에이전트를 위한 사람과 같은 메모리 시스템 연구

OpenClaw 에이전트가 사람처럼 망각되는 메모리를 구현하기 위한 연구 결과


문제 제기

현재 에이전트 메모리의 한계

  1. 시간적 오염 문제

    • Karpathy의 게시글이 2개월 전 정보임에도 불구하고
    • 현재 에이전트가 마치 최신 정보처럼 답변하는 경향
  2. 맥락 없는 질문 반복

    • “어떤 일을 하고 있었죠?” 같은 맥락 없는 질문에도
    • 이전 세션 내용을 기억 못하고 물어보는 경우가 너무 많음

결론

에이전트의 답변 퀄리티를 저하시키거나 컨텍스트를 낭비하게 만듦


해결 방안: 사람의 뇌 메모리 모델링

핵심 원칙

사람의 뇌처럼 retrieve 되지 않는 기억을 점진적 퇴화시켜야 한다

메모리 퇴화 규칙

기억 유형저장 기간퇴화 속도
Fact (사실)오래 저장됨느리게 사라짐
Episode (일상대화)빠르게 사라짐빠르게 사라짐
높은 중요도천천히 잊혀짐느리게 퇴화
낮은 중요도빨리 잊혀짐빠르게 퇴화

수학적 모델링

최적화 기준

  • LongMemEval Benchmark 기준으로 최적화 진행
  • 81% 정확도 달성

벤치마크 성적

벤치마크성적
LongMemEval81% 정확도
LoCoMo준수한 성적 기록
다른 벤치마크일관된 성적 달성

목표

수학적으로 모델링하여 기억이 어떻게 사라지는지 예측 가능하게 디자인


연관성 강화: Association Boosting

핵심 아이디어

“충주 사과가 맛있네”와 같이 연관된 기억이 boost 점수를 얻어 강화

작동 방식

  1. 기존 기억 생성

    기억: "충주 사과가 맛있네"
    중요도: 기본값
    
  2. 연관 기억 접근 시 Boosting

    질문: "충주 시에 충주 사과가 맛있었지?"
    
    → 기존 "충주 사과가 맛있네" 기억을 검색
    → 연관성으로 인식
    → Boost 점수 적용
    → 기억 강화
    

효과

  • 연관된 기억 접근 시 강화
  • 자연스러운 대화 흐름 (사람처럼 맥락 이어짐)
  • 맥락 없는 질문 감소 (연관된 기억이 자동 트리거됨)

구현 고려사항

기억 저장소 구조

class Memory:
    id: str
    content: str
    importance: float  # 0.0 ~ 1.0
    created_at: datetime
    last_accessed_at: datetime
    access_count: int
    type: Enum # Fact, Episode
 
    def decay_score(self) -> float:
        """시간과 중요도에 따른 퇴화 점수 계산"""
        age_days = (now - self.last_accessed_at).days
        base_decay = exp(-0.1 * age_days)  # 기하급 퇴화
        importance_factor = self.importance
        return base_decay * importance_factor
 
    def access(self):
        """기억 접근 시 업데이트"""
        self.last_accessed_at = now()
        self.access_count += 1
        # 연관 기억 boosting 검색 후 수행

검색 알고리즘

def retrieve_memories(query: str, top_k: int = 10) -> List[Memory]:
    """
    1. 임베딩 기반 유사도 검색
    2. decay_score로 정렬
    3. 연관 기억 boosting 점수 계산
    4. 최종 스코어 = 유사도 * decay_score * boost_score
    5. top_k 반환
    """

적용 대상

OpenClaw

Claude Code


핵심 통찰

  1. 퇴화가 필수

    • 오래된 정보가 최신 정보처럼 답변되는 것 방지
    • 컨텍스트 낭비 방지
    • 답변 퀄리티 유지
  2. 연관성이 핵심

    • 사람의 뇌는 고립된 기억이 아닌 연결된 네트워크
    • Association Boosting이 이를 모델링
  3. 수학적 예측 가능성

    • 어떤 기억이 언제 사라지는지 예측
    • 기억 관리 시스템 설계 가능

연구 제한사항

  • 현재 백엔드 구현에서 테스트 안 됨
  • 정확한 벤치마크 데이터셋 필요
  • 실제 OpenClaw/Claude Code 환경에서 검증 필요

관련 자료

  • LongMemEval Benchmark: [링크 필요]
  • LoCoMo: [링크 필요]
  • LinkedIn 게시글: 원본

Added: 2026-03-31