agentmemory

#1 Persistent memory for AI coding agents based on real-world benchmarks. iii-engine 기반 오픈소스 메모리 서버.

개요

agentmemory는 AI 코딩 에이전트용 지속 메모리(persistent memory) 서버다. Claude Code, Cursor, Gemini CLI, Codex CLI, OpenCode, Hermes Agent, OpenClaw, etc. 15+ 에이전트를 동시에 지원하며, 하나의 메모리 서버를 모든 에이전트가 공유한다.

핵심 철학은 “매 세션 처음 5분을 재설명하는 시간을 없애자” 이다. 세션 1에서 JWT 인증을 설정하고, 세션 2에서 rate limiting을 요청하면, 에이전트가 이미 코드베이스 구조를 알고 있어 재설명이 필요 없다.

핵심 성능

지표	값	비고
Retrieval R@5	95.2%	LongMemEval-S (ICLR 2025, 500문항)
Retrieval R@10	98.6%	LongMemEval-S
MRR	88.2%	Mean Reciprocal Rank
토큰 절감	92%	기존 대비 (~1,900 tokens/session)
연간 비용	~$10	로컬 임베딩 시 $0
MCP 도구	51개	가장 포괄적인 MCP 메모리 툴셋
자동 후킹	12개	Claude Code hooks
외부 DB 의존	0개	SQLite + iii-engine 자체 보유
테스트 통과	827개	CI 파이프라인

기술 스택

계층	기술
언어	TypeScript 76.5%, HTML, JavaScript, CSS, Python
엔진	iii-engine v0.11.2 (고유 엔진, Rust 기반)
검색	BM25 + Vector (all-MiniLM-L6-v2) + Knowledge Graph (RRF Fusion)
저장소	SQLite (외부 의존성 없음)
임베딩	로컬 (all-MiniLM-L6-v2, 무료), Gemini, OpenAI, Voyage, Cohere, OpenRouter
인터페이스	MCP, REST API, WebSocket, 12 Hooks
배포	npx (npm), Docker, 소스 빌드
라이선스	Apache-2.0

작동 방식

메모리 파이프라인

PostToolUse hook fires
  → SHA-256 dedup (5min window)
  → Privacy filter (strip secrets, API keys)
  → Store raw observation
  → LLM compress → structured facts + concepts + narrative
  → Vector embedding (6 providers + local)
  → Index in BM25 + vector

SessionEnd hook fires
  → Summarize session
  → Knowledge graph extraction
  → Slot reflection

SessionStart hook fires
  → Load project profile (concepts, files, patterns)
  → Hybrid search (BM25 + vector + graph)
  → Token budget (default: 2000 tokens)
  → Inject into conversation

4-Tier Memory Consolidation (인간 뇌 모방)

계층	역할	비유
Working	툴 사용으로부터의 원시 관찰	단기 기억
Episodic	압축된 세션 요약	”무슨 일이 있었는가”
Semantic	추출된 사실과 패턴	”내가 아는 것”
Procedural	워크플로우와 의사결정 패턴	”하는 방법”

메모리는 시간에 따라 decay (에빙하우스 곡선)
자주 접근하는 메모리는 강화
오래된 메모리는 자동 제거
모순이 발견되면 해결

지원하는 에이전트

에이전트	연결 방식
Claude Code	12 hooks + MCP + skills
OpenClaw	MCP + plugin
Hermes Agent	MCP + memory provider plugin
Cursor	MCP server
Gemini CLI	MCP server
OpenCode	MCP server
Codex CLI	MCP server
Cline / Goose / Kilo Code	MCP server
Claude Desktop	MCP server
Aider	REST API
기타 32+ 에이전트	MCP / REST

설치 및 사용

# 서버 시작 (한 줄)
npx @agentmemory/agentmemory
 
# 데모 데이터 시드 + 검색 테스트
npx @agentmemory/agentmemory demo
 
# 리얼타임 뷰어: http://localhost:3113

Hermes Agent 연동

# ~/.hermes/config.yaml
mcp_servers:
  agentmemory:
    command: npx
    args: ["-y", "@agentmemory/mcp"]
 
memory:
  provider: agentmemory

이후 Hermes Agent는 agentmemory를 통해 세션 간 컨텍스트를 유지한다. Hermes 전용 6-훅 메모리 제공자 플러그인은 integrations/hermes/ 디렉토리에 위치.

Claude Code 연동 (원블록)

Install agentmemory: run `npx @agentmemory/agentmemory` in a separate terminal.
Then run `/plugin marketplace add rohitg00/agentmemory` and `/plugin install agentmemory`
— 자동으로 12 hooks + 4 skills + 51 MCP tools 등록.

주요 MCP 도구 (51개)

도구	설명
`memory_recall`	과거 관찰 검색
`memory_save`	인사이트/결정/패턴 저장
`memory_smart_search`	하이브리드 의미+키워드 검색
`memory_sessions`	최근 세션 목록
`memory_profile`	프로젝트 프로파일 (개념, 파일, 패턴)
`memory_patterns`	반복 패턴 탐지
`memory_timeline`	시간순 관찰
`memory_graph_query`	지식 그래프 순회
`memory_file_history`	특정 파일에 대한 과거 관찰
`memory_relations`	관계 그래프 질의
`memory_consolidate`	4-계층 통합 실행
`memory_governance_delete`	감사 추적과 함께 삭제
`memory_lease`	독점 액션 임대 (멀티 에이전트)
`memory_signal_send/read`	에이전트 간 메시징
`memory_snapshot_create`	Git-버전 스냅샷
`memory_sentinel_create/trigger`	이벤트 구동 감시자
`memory_diagnose/heal`	건강 검사 + 자동 복구

경쟁 제품 비교

항목	agentmemory	mem0 (53K⭐)	Letta/MemGPT (22K⭐)	Built-in (CLAUDE.md)
유형	Memory engine + MCP server	Memory layer API	Full agent runtime	Static file
Retrieval R@5	95.2%	68.5% (LoCoMo)	83.2% (LoCoMo)	N/A (grep)
자동 캡처	12 hooks (제로 수동)	Manual add()	Agent self-edits	Manual editing
검색	BM25+Vector+Graph (RRF)	Vector+Graph	Vector (archival)	전체를 context에
멀티 에이전트	MCP+REST+leases+signals	API (조정 없음)	Letta 런타임 내부	파일별 분리
프레임워크 종속	없음 (모든 MCP 클라이언트)	없음	높음 (Letta 필수)	포맷별
외부 의존성	없음 (SQLite + iii)	Qdrant/pgvector	Postgres + vector	없음
메모리 생애주기	4-tier + decay + auto-forget	수동 추출	Agent 관리	수동 정리
토큰 효율	~1,900 tokens/session ($10/yr)	통합에 따라 다름	컨텍스트 내 핵심	22K+ at 240 obs
리얼타임 뷰어	예 (:3113)	Cloud dashboard	Cloud dashboard	없음
셀프 호스팅	예 (기본값)	선택 사항	선택 사항	예

프로젝트 정보

항목	값
Stars	~4,320 (2026-05-11 기준, 급성장 중)
Forks	408
Open Issues	37
License	Apache-2.0
최신 버전	v0.9.8 (2026-05-11)
생성일	2026-02-25 (약 3개월)
홈페이지	https://agent-memory.dev
창시자	rohitg00 (255 commits)
주요 기여자	Tanmay-008, JasonLandbridge, Getty
디자인 문서	Viral GitHub Gist (1,050 ⭐)

Karpathy LLM Wiki와의 연결

agentmemory의 디자인 문서는 Karpathy의 LLM Wiki 패턴을 직접 확장한다:

Gist에서 confidence scoring, lifecycle, knowledge graph, hybrid search를 원래 LLM Wiki 패턴에 추가
여기에 iii-engine을 붙여 실제 구현체로 만든 것
Memory Tree + Obsidian Wiki 조합을 채택한 OpenHuman과 유사한 계보

해석

agentmemory는 “AI 코딩 에이전트용 범용 메모리 서버”라는 포지셔닝으로, 에이전트 간 메모리 공유가 핵심 차별점이다.

강점:

15개 이상의 에이전트를 단일 메모리 서버로 통합 → 에이전트 전환 시 컨텍스트 손실 없음
95.2% R@5는 LongMemEval-S에서 공개된 최고 수준
외부 의존성 제로 (SQLite + iii-engine) → 설치가 npx 한 줄
51개 MCP 도구와 12개 hooks는 가장 포괄적인 메모리 툴셋
에이전트 SDK(Cline, Goose, WindSurf 등)와도 호환 → 에코시스템 넓음

약점:

프로젝트 생성 3개월 미만 (2026-02-25) → 장기 안정성 미검증
iii-engine(v0.11.2)에 종속 → 엔진 업데이트 시 호환성 리스크 (README에서 명시)
4-tier consolidation + knowledge graph가 활성화되면 LLM API 비용 발생 가능
한국어/일본어 등 비영어권 embedding recall은 검증 필요

** 관점:**

Hermes Agent가 이미 memory provider로 agentmemory를 지원함 → 현재 환경에 즉시 적용 가능
2026-05-06-claude-code-codex-memory-tools에서 이미 언급됐지만 벤치마크 수치/상세 구조는 새로 정리
moc-ai-agents-memory의 핵심 비교 대상으로 추가할 가치 높음
Karpathy LLM Wiki 패턴을 확장한 설계 → moc-llm-wiki와도 연결

LLM Wiki

탐색기

agentmemory — #1 Persistent memory for AI coding agents