MOC - 중국 LLM 플래그십 모델 비교 (2026-05)
인기 중국 LLM 7개 벤더의 최신 플래그십을 가격·특징·벤치마크로 비교한 스냅샷. 1군 6개(DeepSeek·Qwen·Kimi·GLM·Doubao·MiniMax) + Xiaomi MiMo.
신뢰도 주의
벤치마크 점수 대부분은 각 벤더 자체 발표(모델카드) 기준이고 측정 조건(AIME 연도·툴 사용 여부·SWE-Bench 버전)이 달라 1:1 비교는 근사치다. USD 단가는 위안화/공식가 환산이라 출처별 편차가 있다(위안화 우선). 기준일 2026-05-31 — 일부 가격은 변동 중(특히 DeepSeek 프로모 종료).
사양 · 가격 종합표
| 벤더 | 최신 플래그십 | 출시 | 아키텍처(총/활성) | 컨텍스트 | 라이선스 | 입력$/1M | 출력$/1M | 캐시적중 입력 |
|---|---|---|---|---|---|---|---|---|
| DeepSeek | V4-Pro | 26-04-24 | 1.6T MoE / 49B | 1M | ✅ MIT | ~$0.44* | ~$0.87* | ~$0.0036* |
| Alibaba Qwen | Qwen3.7-Max | 26-05-20 | 비공개 MoE | 1M | ❌ 독점 | $2.50 | $7.50 | $0.25 |
| Moonshot Kimi | K2.6 | 26-04-21 | 1T MoE / 32B | 256K | ✅ MIT 변형 | $0.95 | $4.00 | $0.16 |
| Zhipu GLM | GLM-5.1 | 26-04-07 | 754B MoE | 200K | ✅ MIT | $1.40 | $4.40 | — |
| ByteDance Doubao | Seed-2.0 Pro | 26-02-14 | 비공개 | 256K | ❌ 독점 | ~$0.47 (¥3.2) | ~$2.37 (¥16) | ~$0.09 (¥0.64) |
| MiniMax | M2.7 | 26-03-18 | 230B MoE / 10B | ~200K | ✅ 오픈웨이트 | $0.30 | $1.20 | $0.06 |
| Xiaomi MiMo | V2.5-Pro | 26-04-28 | 1.02T MoE / 42B | 1M | ✅ MIT | ~$0.42 (¥3) | ~$0.84 (¥6) | ~$0.0035 (¥0.025) |
* DeepSeek 가격 주의: V4-Pro 75% 할인 프로모가 2026-05-31 종료, 6/1부터 영구가. 위안화 영구가 ¥3/¥6/¥0.025(≈0.84/1.74/0.0145)가 ~4배 어긋남 → 결제 전 재확인. V4-Flash 단일가 0.28. Qwen·Kimi는 위안화 단가 미공개.
벤치마크 종합표 (자체 발표 기준, 조건 상이 — 근사 비교)
| 모델 | SWE Verified | SWE Pro | LiveCodeBench | AIME 2026 | GPQA-Diamond | Terminal-Bench 2 |
|---|---|---|---|---|---|---|
| DeepSeek V4-Pro | 80.6 | 55.4 | 93.5 | 96.4† | 90.1 | 67.9 |
| Qwen3.7-Max | 80.4 | 60.6 | 91.6 | (HMMT 97.1)‡ | 92.4 | 69.7 |
| Kimi K2.6 | 80.2 | 58.6 | 89.6 | 96.4 | 90.5 | 66.7 |
| GLM-5.1 | 77.8§ | 58.4 | — | 95.3 | 86.2 | 63.5 |
| Doubao Seed-2.0 Pro | 76.5 | — | 87.8 | 94.2 | 88.9 | 55.8 |
| MiniMax M2.7 | (미발표)¶ | 56.2 | (M2: 83) | — | — | 57.0 |
| MiMo-V2.5-Pro | 78.9 | 57.2 | (base 39.6)◊ | (base 37.3)◊ | 66.7◊ | 68.4 |
- † DeepSeek AIME 2026 96.4는 제3자 블로그치(공식 카드는 HMMT/IMO로 대체) — 불확실.
- ‡ Qwen은 AIME 대신 HMMT 2026 97.1 발표.
- § GLM-5.1 SWE-Pro 58.4(자체)로 일부 코딩 지표만 GPT-5.4·Opus 4.6 근소 추월. Verified 77.8은 GLM-5 수치.
- ¶ MiniMax M2.7은 Verified/AIME/GPQA 공식 미발표(차세대 고난도 벤치만 발표). 직전 M2.5는 Verified 80.2.
- ◊ MiMo-V2.5-Pro GPQA 66.7·AIME 37.3·LiveCodeBench 39.6은 base/few-shot 측정으로 과소. SWE 계열(78.9/57.2)이 실사용 지표.
벤더별 핵심
- DeepSeek V4-Pro — 오픈웨이트 최강 코딩/에이전트. 통합 추론(Non/High/Max), 캐시 적중 시 사실상 무료 단가. “V4PLUS/Pro Max”는 별도 모델이 아니라 Think Max 모드. → deepseek-v4, 2026-04-24-threads-choi-openai-deepseek-v4-openweights
- Qwen3.7-Max — “에이전트 시대” 독점 플래그십, ~35시간 연속 자율 실행, MCP 드롭인 호환. 파라미터 비공개. 오픈은 2026-04-22-qwen3-6-27b-open-source-agentic-coding·2026-04-16-qwen3-6-35b-a3b·2026-04-05-qwen3-6-plus가 담당.
- Kimi K2.6 — 오픈웨이트 코딩 SOTA. 에이전트 스웜 최대 300 병렬/4,000 스텝, SWE-Bench Pro에서 GPT-5.4 근소 추월. → 2026-04-20-kimi-k2-6, 2026-04-20-kimi-k2-6-vs-qwen3-6-vs-opus-4-7
- GLM-5.1 — MIT 754B MoE, 화웨이 Ascend+MindSpore 학습(엔비디아 의존 0), Code Arena Elo 1530 으로 오픈웨이트 최초 글로벌 3위. “GPT/Opus 추월”은 SWE-Pro 단일 지표 한정.
- Doubao Seed-2.0 Pro — 중국 1위 소비자 앱(주간 ~1.55억 사용), 독점, 영상이해 강점(VideoMME 89.5).
- MiniMax M2.7 — 에이전트 특화 오픈웨이트, 표 내 최저가(1.20), 자기진화·Agent Teams·MMX-CLI. 멀티모달은 전문 모델 묶음. → 2026-03-29-minimax-glm-kimi-coding-comparison
- Xiaomi MiMo-V2.5-Pro — MIT 1.02T MoE, 1M, 2026-05-27 가격 최대 99% 영구 인하(캐시 적중 ¥2.80→¥0.025). 토큰 효율 강점, TTS 무료. → 2026-05-28-xiaomi-mimo-v2-5-price-cut-99-percent, 2026-04-22-xiaomi-mimo-v2-5-open-source-agents-forward
교차 관찰
- 가격 경쟁이 본질 — 출력 토큰 0.004까지. 서구 플래그십 대비 5~30배 저렴.
- 오픈웨이트가 다수 — 7개 중 5개 가중치 공개(MIT 계열). 독점은 Qwen-Max·Doubao 둘뿐(빅테크 알리바바·바이트댄스).
- 코딩/에이전트로 무게중심 이동 — 전 벤더 SWE-Bench·Terminal-Bench 핵심 지표화, 장기 자율 실행(수십 시간·수천 스텝)이 새 격전지.
- 1M 컨텍스트 클럽 — DeepSeek·Qwen·MiMo(3개). Kimi·Doubao는 256K.
종합 랭킹(2026 상반기 艾媒金榜): DeepSeek > 千问(Qwen) > 豆包(Doubao) > 元宝 > Kimi > 文心(Ernie) > 讯飞星火 > 智谱(GLM) > 天工 > MiniMax.
관련 노트
- 2026-05-31-deepseek-v4-pro-cheapest-access — DeepSeek-V4-Pro 가장 저렴하게 쓰는 법 (API/제공사/자가호스팅)
- 2026-04-24-openrouter-model-pricing-comparison — OpenRouter 출시 모델 가격·컨텍스트 비교표
- 2026-04-25-ai-model-category-picks — 카테고리별 최고 AI 모델 셀렉션
- 2026-04-16-stanford-ai-index-2026 — 미중 AI 격차 축소 연간 보고