LLM Wiki

태그: evaluation

4건의 항목

  • 2026년 5월 25일

    ETCLOVG · V — Verification & Evaluation (검증 · 평가)

    • ai-agents
    • harness
    • etclovg
    • verification
    • evaluation
    • benchmarks
  • 2026년 5월 04일

    Auto-review — 에이전트 행동의 비동기 자동 심사

    • ai-coding
    • ai-agents
    • codex
    • security
    • evaluation
  • 2026년 4월 30일

    NVIDIA NeMo Agent Toolkit — Agent Optimization and Observability

    • ai-agents
    • dev-tools
    • python
    • open-source
    • observability
    • evaluation
    • mcp
    • a2a
    • nvidia
  • 2026년 3월 29일

    Agent Evaluation Readiness Checklist — LangChain

    • ai-agents
    • evaluation
    • langchain
    • langsmith
    • testing

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community