LLM Wiki

태그: benchmark

7건의 항목

  • 2026년 5월 04일

    Anubis — Local LLM Benchmarking for Apple Silicon

    • dev-tools
    • macos
    • apple-silicon
    • llm
    • benchmark
    • swift
    • open-source
  • 2026년 4월 20일

    Kimi K2.6 vs Qwen3.6 vs Claude Opus 4.7 — 2026년 4월 코딩 에이전트 모델 선택 가이드

    • ai-models
    • ai-coding
    • comparison
    • open-source
    • benchmark
  • 2026년 4월 20일

    Kimi K2.6 — 오픈소스 코딩 모델 업그레이드와 장기 실행·Agent Swarm 강화

    • ai-models
    • ai-coding
    • open-source
    • multi-agent
    • benchmark
  • 2026년 4월 17일

    Claude Opus 4.7 — xhigh effort, ultrareview, adaptive thinking 논점

    • ai-coding
    • anthropic
    • claude-code
    • benchmark
    • automation
  • 2026년 4월 16일

    AI 에이전트 스킬, 벤치마크 성능의 절반도 현실에서 안 나온다

    • ai-agents
    • research
    • benchmark
    • harness
  • 2026년 4월 10일

    Factory Droid 데스크톱 앱 출시 — macOS·Windows

    • ai-coding
    • computer-use
    • desktop-app
    • benchmark
    • enterprise
    • agent
  • 2026년 4월 07일

    AI 에이전트 메모리 레이어 3-Way 비교 — Honcho vs Mem0 vs SuperMemory

    • ai-agents
    • llm
    • memory
    • benchmark
    • productivity

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community