The Brain - Multimodal RAG Dashboard & 3D Knowledge Graph

문서(텍스트, 이미지, 테이블, 수식)를 로컬 또는 클라우드 LLM으로 처리하고 대화형 3D 지식 그래프로 탐색하는 RAG 대시보드

Overview

The Brain은 다중 모달(multimodal) 문서를 인게스트하고 대화형 3D Knowledge Graph로 탐색할 수 있는 RAG 대시보드다.

핵심 특징:

  • 다중 모달 인게스트: 텍스트, 이미지, 테이블, 수식 통합 처리
  • 3D Knowledge Graph 시각화: Neo4j 기반 그래프를 대화형으로 탐색
  • 하이브리드 실행: 로컬(Ollama, llama.cpp, vLLM, LM Studio) 또는 클라우드(OpenAI 호환 API)
  • Fully offline 가능: 로컬 모델만으로 전담 가능

Architecture

┌─────────────────────────────────────────────────────┐
│                    Frontend (Web UI)                  │
│         3D Knowledge Graph + RAG Query UI             │
├─────────────────────────────────────────────────────┤
│              Backend: FastAPI + Uvicorn               │
│         SSE (Server-Sent Events) for log streaming    │
├─────────────────────────────────────────────────────┤
│                                                         │
│  ┌──────────────┐  ┌──────────────┐  ┌────────────┐  │
│  │   LightRAG   │  │ RAG-Anything │  │   MinerU   │  │
│  │  (RAG 파이프라인)  │  (다중 모달)  │  │  (PDF 파서)  │  │
│  └──────────────┘  └──────────────┘  └────────────┘  │
│                                                         │
│  ┌──────────────┐  ┌──────────────┐                   │
│  │    Neo4j     │  │ NanoVectorDB │                   │
│  │ (Knowledge Graph) │ (Vector Store) │                   │
│  └──────────────┘  └──────────────┘                   │
│                                                         │
│  ┌──────────────┐                                     │
│  │BGE-Reranker-v2-m3│                                  │
│  │ (Default reranker) │                                  │
│  └──────────────┘                                     │
└─────────────────────────────────────────────────────┘
         ▲                              ▲
    Local LLM Providers            Cloud APIs
  Ollama / llama.cpp / vLLM / LM Studio / OpenAI

컴포넌트 상세:

컴포넌트기술역할
BackendPython, FastAPI, UvicornAPI 서버 + SSE 로깅
RAG PipelineLightRAG + RAG-Anything검색 증강 생성 파이프라인
Document ParserMinerUPDF 레이아웃 인식, OCR, 다중 모달 추출
Knowledge Graph DBNeo4j그래프 기반 지식 저장
Vector DBNanoVectorDB의미론적 검색
RerankerBAAI/bge-reranker-v2-m3검색 결과 재순위화

LLM Engine Support

LLM_ENGINE 환경변수로 로컬/클라우드 간 전환 가능:

EngineBase URL비고
ollamahttp://localhost:11434로컬 기본값
llamacpphttp://localhost:8080/v1llama.cpp 서버
vllmhttp://localhost:8000/v1고성능 vLLM
lmstudiohttp://localhost:1234/v1LM Studio
openaihttps://api.openai.com/v1클라우드

Default 모델 구성:

용도모델비고
LLM (텍스트)qwen3.5:9b엔티티 추출 + 쿼리
Vision (이미지/표/수식)qwen2.5vl:latest다중 모달 처리
Embeddingqwen3-embedding:8b벡터화
Rerankerqwen3-reranker-0.6b선택적

Settings

LLM 설정:

변수기본값설명
LLM_NUM_CTX32768컨텍스트 윈도우
LLM_TIMEOUT300s응답 타임아웃
LLM_MAX_ASYNC1최대 동시 요청

Embedding 설정:

변수기본값설명
EMBEDDING_DIM4096벡터 차원 (모델 아키텍처와 일치 필수)
MAX_EMBED_TOKENS8192임베딩 모델 최대 컨텍스트
EMBEDDING_TIMEOUT300s임베딩 타임아웃

Chunk 설정:

변수기본값설명
CHUNK_SIZE600청크당 토큰 수
CHUNK_OVERLAP_SIZE100인접 청크 간 오버랩

Storage

Volume내용
thebrain_dataVector DB, 업로드 이력, 파싱 결과
lightrag_neo4j_dataNeo4j 그래프 데이터

Quick Start

# Docker Compose 파일 생성
services:
  the-brain:
    image: ghcr.io/hastur-hp/the-brain:latest
    container_name: the_brain
    restart: unless-stopped
    network_mode: host
    environment:
      # LLM Engine 설정
      LLM_ENGINE: ollama
      OLLAMA_BASE_URL: http://localhost:11434
      OPENAI_API_KEY: sk-local-test-key  # 더미 키 (OpenAI 포맷 사용 시)
      
      # 모델 설정
      LLM_MODEL: qwen3.5:9b
      VISION_MODEL: qwen2.5vl:latest
      EMBEDDING_MODEL: qwen3-embedding:8b
      
    volumes:
      - thebrain_data:/app/data
      - lightrag_neo4j_data:/data

Source

  • GitHub: https://github.com/Hastur-HP/The-Brain
  • Stars: 12 | Forks: 1 | License: MIT
  • Languages: JavaScript (35.6%), Python (30.1%), CSS (18.6%), HTML (15.7%)
  • Latest Release: v1.1.1 (2026-03-22)