Xiaomi MiMo-V2.5 — 오픈소스 에이전트 성능을 끌어올리는 모델

오픈소스 에이전트 작업과 장기 실행 툴 호출을 전면에 내세운 Xiaomi의 최신 모델.

요약

Xiaomi MiMo는 MiMo-V2.5 시리즈를 “Open-Source Agents Forward”라는 메시지로 공개했다. 핵심은 단순 채팅 모델이 아니라, 에이전트형 작업과 장기 실행 태스크를 잘 처리하는 모델이라는 점이다.

트윗 기준으로 MiMo-V2.5-Pro는 다음을 강조한다.

  • 일반적인 agentic capability 향상
  • 복잡한 software engineering 작업 개선
  • long-horizon task 수행 능력 강화
  • Claude Opus 4.6, GPT-5.4와의 benchmark 경쟁 언급
  • 1,000+ tool calls가 필요한 전문 작업 자동 완수

또한 MiMo-V2.5는 native omnimodal 모델로 설명되며,

  • image/video understanding
  • 1M token context window
  • 더 효율적인 inference
  • 절반 수준 비용의 pro-level agent performance 를 내세운다.

관점

이 노트가 중요한 이유는, 오픈소스 모델 경쟁이 이제 “대화 품질”보다 에이전트 작업 수행력장기 실행 안정성으로 이동하고 있다는 신호이기 때문이다. 이 관심 있는 Claude Code / OpenClaw / workspace agents 축과 직접 맞닿아 있다.

원문에서 눈에 띄는 포인트

  • SWE-bench Pro 57.2
  • Claw-Eval 63.8
  • τ3-Bench 72.9
  • professional tasks with 1,000+ tool calls
  • native 1M-token context

업데이트