LLM Wiki
Search
검색
다크 모드
라이트 모드
탐색기
태그: evaluation
4건의 항목
2026년 5월 25일
ETCLOVG · V — Verification & Evaluation (검증 · 평가)
ai-agents
harness
etclovg
verification
evaluation
benchmarks
2026년 5월 04일
Auto-review — 에이전트 행동의 비동기 자동 심사
ai-coding
ai-agents
codex
security
evaluation
2026년 4월 30일
NVIDIA NeMo Agent Toolkit — Agent Optimization and Observability
ai-agents
dev-tools
python
open-source
observability
evaluation
mcp
a2a
nvidia
2026년 3월 29일
Agent Evaluation Readiness Checklist — LangChain
ai-agents
evaluation
langchain
langsmith
testing