Graphify — On-Device Knowledge Graph Engine for AI Coding

pip install graphifyy && graphify . — 어떤 폴더든 쿼리 가능한 지식 그래프로 변환. 38k+ stars, 400k+ downloads.

한 줄 요약

Graphify는 코드, 문서, 논문, 이미지, 비디오를 하나의 지식 그래프로 변환하는 AI 코딩 어시스턴트 스킬. /graphify 한 줄이면 폴더 전체를 AST 추출 → 의미 분석 → Leiden 클러스터링 → 인터랙티브 HTML 그래프로 변환한다.

핵심 특징

  • Fully multimodal: 코드, PDF, 마크다운, 스크린샷, 다이어그램, 화이트보드 사진, 비디오/오디오까지 모두 그래프로 통합
  • 25개 언어 지원: Python, JS, TS, Go, Rust, Java, C, C++, Ruby, C#, Kotlin, Scala, PHP, Swift, Lua, Zig, PowerShell, Elixir, Objective-C, Julia, Verilog, SystemVerilog, Vue, Svelte, Dart
  • 3-pass 아키텍처:
    1. Deterministic AST: LLM 없이 구조 추출 (클래스, 함수, 임포트, 콜그래프, docstring, rationale comments)
    2. Whisper transcription: faster-whisper로 비디오/오디오 로컬 트랜스크립션 (캐시 지원)
    3. Claude subagents: 논문, 이미지, 문서에서 개념·관계·설계 의도 추출 (병렬 처리)
  • Incremental graph: 변경된 파일만 패치. 수백만 파일 규모에서도 전체 재빌드 불필요
  • Topology-based clustering: 임베딩 없이 Leiden 커뮤니티 탐지. 의미적 유사성 엣지가 클러스터링에 직접 영향
  • Confidence tagging: 모든 관계는 EXTRACTED(소스에서 직접 발견), INFERRED(합리적 추론, 신뢰도 점수), AMBIGUOUS(검토 필요)로 태깅
  • 71.5x 토큰 절약: 원시 파일 직접 읽기 대비 쿼리당 토큰 소비량

Karpathy 연결점

Karpathy가 /raw 폴더에 논문, 트윗, 스크린샷, 노트를 쌓아두는 패턴을 언급하면서, Graphify를 그 문제의 해결책으로 포지셔닝:

“Andrej Karpathy keeps a /raw folder where he drops papers, tweets, screenshots, and notes. graphify is the answer to that problem.”

[[2026-04-03-karpathy-llm-knowledge-bases]]의 컨텍스트와 연결된다. Graphify는 지식 베이스 구축 파이프라인 중 “구조화” 단계를 자동화한다.

작동 방식

/graphify .    # 어떤 폴더든 — 코드, 노트, 논문, 다이어그램 등

출력

파일설명
graph.html인터랙티브 그래프 (브라우저에서 열기, 클릭, 검색, 커뮤니티 필터)
GRAPH_REPORT.mdgod nodes, 예상치 못한 연결, 추천 질문
graph.json지속적 그래프 (몇 주 뒤에도 재추출 없이 쿼리 가능)
cache/SHA256 캐시 (변경된 파일만 재처리)

.graphifyignore

vendor/
node_modules/
dist/
*.generated.py

.gitignore와 동일한 문법. 저장소 루트에 단일 파일 유지.

Incremental Graph

기존 RAG 파이프라인이 변경마다 전체 재임베딩하는 것과 달리, Graphify는 살아있는 그래프 유지:

  • 파일 변경 시 영향받은 하위 그래프만 재추출 → 패치
  • 나머지 코퍼스는 그대로 유지
  • graphify watch . — 라이브 파일 감시 (LLM 없이 AST만, 무료)

멀티 에이전트 관점

Graphify는 Claude Code, Codex, OpenCode, Cursor, Gemini CLI, GitHub Copilot CLI, VS Code Copilot Chat, Aider, OpenClaw, Factory Droid, Trae, Hermes, Kiro, Google Antigravity 등 16개 AI 코딩 도구에서 /graphify 스킬로 동작한다.

지원 AI 코딩 도구

  • Claude Code, Codex, OpenCode, Cursor
  • Gemini CLI, GitHub Copilot CLI, VS Code Copilot Chat
  • Aider, OpenClaw, Factory Droid, Trae
  • Hermes, Kiro, Google Antigravity

엔터프라이즈

  • On-prem / air-gapped 또는 managed cloud 선택 가능
  • Million-file corpus, 팀 지식 그래프, RBAC, SSO, SOC 2, 99.9% SLA

관련 노트

핵심 인사이트

  1. Embedding-less clustering: Leiden 커뮤니티 탐지가 임베딩+벡터DB를 대체. 구조 자체가 유사성 신호 — 별도 임베딩 스텝 불필요
  2. Incremental over batch: RAG의 “변경=재구축” 문제를 그래프 패치로 해결. 프로덕션 스케일에서 결정적 차이
  3. Multimodal-first: 코드 AST부터 이미지 vision, 오디오 Whisper까지 — 단일 그래프로 통합
  4. Confidence as first-class: EXTRACTED/INFERRED/AMBIGUOUS 태깅으로 신뢰성 투명성 확보. 2026-04-30-composio-agent-orchestrator의 verification loop와 유사한 철학