LLM Wiki
Search
검색
다크 모드
라이트 모드
탐색기
태그: benchmark
7건의 항목
2026년 5월 04일
Anubis — Local LLM Benchmarking for Apple Silicon
dev-tools
macos
apple-silicon
llm
benchmark
swift
open-source
2026년 4월 20일
Kimi K2.6 vs Qwen3.6 vs Claude Opus 4.7 — 2026년 4월 코딩 에이전트 모델 선택 가이드
ai-models
ai-coding
comparison
open-source
benchmark
2026년 4월 20일
Kimi K2.6 — 오픈소스 코딩 모델 업그레이드와 장기 실행·Agent Swarm 강화
ai-models
ai-coding
open-source
multi-agent
benchmark
2026년 4월 17일
Claude Opus 4.7 — xhigh effort, ultrareview, adaptive thinking 논점
ai-coding
anthropic
claude-code
benchmark
automation
2026년 4월 16일
AI 에이전트 스킬, 벤치마크 성능의 절반도 현실에서 안 나온다
ai-agents
research
benchmark
harness
2026년 4월 10일
Factory Droid 데스크톱 앱 출시 — macOS·Windows
ai-coding
computer-use
desktop-app
benchmark
enterprise
agent
2026년 4월 07일
AI 에이전트 메모리 레이어 3-Way 비교 — Honcho vs Mem0 vs SuperMemory
ai-agents
llm
memory
benchmark
productivity