LLM Wiki

태그: benchmark

7건의 항목

2026년 5월 04일
Anubis — Local LLM Benchmarking for Apple Silicon
2026년 4월 20일
Kimi K2.6 vs Qwen3.6 vs Claude Opus 4.7 — 2026년 4월 코딩 에이전트 모델 선택 가이드
2026년 4월 20일
Kimi K2.6 — 오픈소스 코딩 모델 업그레이드와 장기 실행·Agent Swarm 강화
2026년 4월 17일
Claude Opus 4.7 — xhigh effort, ultrareview, adaptive thinking 논점
2026년 4월 16일
AI 에이전트 스킬, 벤치마크 성능의 절반도 현실에서 안 나온다
2026년 4월 10일
Factory Droid 데스크톱 앱 출시 — macOS·Windows
2026년 4월 07일
AI 에이전트 메모리 레이어 3-Way 비교 — Honcho vs Mem0 vs SuperMemory

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community