agentmemory

#1 Persistent memory for AI coding agents based on real-world benchmarks. iii-engine 기반 오픈소스 메모리 서버.

개요

agentmemory는 AI 코딩 에이전트용 지속 메모리(persistent memory) 서버다. Claude Code, Cursor, Gemini CLI, Codex CLI, OpenCode, Hermes Agent, OpenClaw, etc. 15+ 에이전트를 동시에 지원하며, 하나의 메모리 서버를 모든 에이전트가 공유한다.

핵심 철학은 “매 세션 처음 5분을 재설명하는 시간을 없애자” 이다. 세션 1에서 JWT 인증을 설정하고, 세션 2에서 rate limiting을 요청하면, 에이전트가 이미 코드베이스 구조를 알고 있어 재설명이 필요 없다.

핵심 성능

지표비고
Retrieval R@595.2%LongMemEval-S (ICLR 2025, 500문항)
Retrieval R@1098.6%LongMemEval-S
MRR88.2%Mean Reciprocal Rank
토큰 절감92%기존 대비 (~1,900 tokens/session)
연간 비용~$10로컬 임베딩 시 $0
MCP 도구51개가장 포괄적인 MCP 메모리 툴셋
자동 후킹12개Claude Code hooks
외부 DB 의존0개SQLite + iii-engine 자체 보유
테스트 통과827개CI 파이프라인

기술 스택

계층기술
언어TypeScript 76.5%, HTML, JavaScript, CSS, Python
엔진iii-engine v0.11.2 (고유 엔진, Rust 기반)
검색BM25 + Vector (all-MiniLM-L6-v2) + Knowledge Graph (RRF Fusion)
저장소SQLite (외부 의존성 없음)
임베딩로컬 (all-MiniLM-L6-v2, 무료), Gemini, OpenAI, Voyage, Cohere, OpenRouter
인터페이스MCP, REST API, WebSocket, 12 Hooks
배포npx (npm), Docker, 소스 빌드
라이선스Apache-2.0

작동 방식

메모리 파이프라인

PostToolUse hook fires
  → SHA-256 dedup (5min window)
  → Privacy filter (strip secrets, API keys)
  → Store raw observation
  → LLM compress → structured facts + concepts + narrative
  → Vector embedding (6 providers + local)
  → Index in BM25 + vector

SessionEnd hook fires
  → Summarize session
  → Knowledge graph extraction
  → Slot reflection

SessionStart hook fires
  → Load project profile (concepts, files, patterns)
  → Hybrid search (BM25 + vector + graph)
  → Token budget (default: 2000 tokens)
  → Inject into conversation

4-Tier Memory Consolidation (인간 뇌 모방)

계층역할비유
Working툴 사용으로부터의 원시 관찰단기 기억
Episodic압축된 세션 요약”무슨 일이 있었는가”
Semantic추출된 사실과 패턴”내가 아는 것”
Procedural워크플로우와 의사결정 패턴”하는 방법”
  • 메모리는 시간에 따라 decay (에빙하우스 곡선)
  • 자주 접근하는 메모리는 강화
  • 오래된 메모리는 자동 제거
  • 모순이 발견되면 해결

지원하는 에이전트

에이전트연결 방식
Claude Code12 hooks + MCP + skills
OpenClawMCP + plugin
Hermes AgentMCP + memory provider plugin
CursorMCP server
Gemini CLIMCP server
OpenCodeMCP server
Codex CLIMCP server
Cline / Goose / Kilo CodeMCP server
Claude DesktopMCP server
AiderREST API
기타 32+ 에이전트MCP / REST

설치 및 사용

# 서버 시작 (한 줄)
npx @agentmemory/agentmemory
 
# 데모 데이터 시드 + 검색 테스트
npx @agentmemory/agentmemory demo
 
# 리얼타임 뷰어: http://localhost:3113

Hermes Agent 연동

# ~/.hermes/config.yaml
mcp_servers:
  agentmemory:
    command: npx
    args: ["-y", "@agentmemory/mcp"]
 
memory:
  provider: agentmemory

이후 Hermes Agent는 agentmemory를 통해 세션 간 컨텍스트를 유지한다. Hermes 전용 6-훅 메모리 제공자 플러그인은 integrations/hermes/ 디렉토리에 위치.

Claude Code 연동 (원블록)

Install agentmemory: run `npx @agentmemory/agentmemory` in a separate terminal.
Then run `/plugin marketplace add rohitg00/agentmemory` and `/plugin install agentmemory`
— 자동으로 12 hooks + 4 skills + 51 MCP tools 등록.

주요 MCP 도구 (51개)

도구설명
memory_recall과거 관찰 검색
memory_save인사이트/결정/패턴 저장
memory_smart_search하이브리드 의미+키워드 검색
memory_sessions최근 세션 목록
memory_profile프로젝트 프로파일 (개념, 파일, 패턴)
memory_patterns반복 패턴 탐지
memory_timeline시간순 관찰
memory_graph_query지식 그래프 순회
memory_file_history특정 파일에 대한 과거 관찰
memory_relations관계 그래프 질의
memory_consolidate4-계층 통합 실행
memory_governance_delete감사 추적과 함께 삭제
memory_lease독점 액션 임대 (멀티 에이전트)
memory_signal_send/read에이전트 간 메시징
memory_snapshot_createGit-버전 스냅샷
memory_sentinel_create/trigger이벤트 구동 감시자
memory_diagnose/heal건강 검사 + 자동 복구

경쟁 제품 비교

항목agentmemorymem0 (53K⭐)Letta/MemGPT (22K⭐)Built-in (CLAUDE.md)
유형Memory engine + MCP serverMemory layer APIFull agent runtimeStatic file
Retrieval R@595.2%68.5% (LoCoMo)83.2% (LoCoMo)N/A (grep)
자동 캡처12 hooks (제로 수동)Manual add()Agent self-editsManual editing
검색BM25+Vector+Graph (RRF)Vector+GraphVector (archival)전체를 context에
멀티 에이전트MCP+REST+leases+signalsAPI (조정 없음)Letta 런타임 내부파일별 분리
프레임워크 종속없음 (모든 MCP 클라이언트)없음높음 (Letta 필수)포맷별
외부 의존성없음 (SQLite + iii)Qdrant/pgvectorPostgres + vector없음
메모리 생애주기4-tier + decay + auto-forget수동 추출Agent 관리수동 정리
토큰 효율~1,900 tokens/session ($10/yr)통합에 따라 다름컨텍스트 내 핵심22K+ at 240 obs
리얼타임 뷰어 (:3113)Cloud dashboardCloud dashboard없음
셀프 호스팅 (기본값)선택 사항선택 사항

프로젝트 정보

항목
Stars~4,320 (2026-05-11 기준, 급성장 중)
Forks408
Open Issues37
LicenseApache-2.0
최신 버전v0.9.8 (2026-05-11)
생성일2026-02-25 (약 3개월)
홈페이지https://agent-memory.dev
창시자rohitg00 (255 commits)
주요 기여자Tanmay-008, JasonLandbridge, Getty
디자인 문서Viral GitHub Gist (1,050 ⭐)

Karpathy LLM Wiki와의 연결

agentmemory의 디자인 문서는 Karpathy의 LLM Wiki 패턴을 직접 확장한다:

  • Gist에서 confidence scoring, lifecycle, knowledge graph, hybrid search를 원래 LLM Wiki 패턴에 추가
  • 여기에 iii-engine을 붙여 실제 구현체로 만든 것
  • Memory Tree + Obsidian Wiki 조합을 채택한 OpenHuman과 유사한 계보

해석

agentmemory는 “AI 코딩 에이전트용 범용 메모리 서버”라는 포지셔닝으로, 에이전트 간 메모리 공유가 핵심 차별점이다.

강점:

  • 15개 이상의 에이전트를 단일 메모리 서버로 통합 → 에이전트 전환 시 컨텍스트 손실 없음
  • 95.2% R@5는 LongMemEval-S에서 공개된 최고 수준
  • 외부 의존성 제로 (SQLite + iii-engine) → 설치가 npx 한 줄
  • 51개 MCP 도구와 12개 hooks는 가장 포괄적인 메모리 툴셋
  • 에이전트 SDK(Cline, Goose, WindSurf 등)와도 호환 → 에코시스템 넓음

약점:

  • 프로젝트 생성 3개월 미만 (2026-02-25) → 장기 안정성 미검증
  • iii-engine(v0.11.2)에 종속 → 엔진 업데이트 시 호환성 리스크 (README에서 명시)
  • 4-tier consolidation + knowledge graph가 활성화되면 LLM API 비용 발생 가능
  • 한국어/일본어 등 비영어권 embedding recall은 검증 필요

** 관점:**

  • Hermes Agent가 이미 memory provider로 agentmemory를 지원함 → 현재 환경에 즉시 적용 가능
  • 2026-05-06-claude-code-codex-memory-tools에서 이미 언급됐지만 벤치마크 수치/상세 구조는 새로 정리
  • moc-ai-agents-memory의 핵심 비교 대상으로 추가할 가치 높음
  • Karpathy LLM Wiki 패턴을 확장한 설계 → moc-llm-wiki와도 연결

관련 노트