SuperGemma4-26B-Uncensored-Fast v2 — Apple Silicon MLX 최적화
Gemma 4 26B IT 기반, 언센서드+속도 튜닝, Apple Silicon MLX 4-bit 양자화. Quick bench +4.4, 속도 +8.7%.
개요
Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2는 Gemma 4 26B IT를 기반으로 한 텍스트 전용(text-only) 언센서드 파인튠이다. Apple Silicon의 MLX 프레임워크에 최적화된 4-bit 양자화 모델로, 로컬 에이전트 워크로드에 특화되어 있다.
- 베이스: Gemma 4 26B IT
- 양자화: 4-bit (MLX)
- 특성: uncensored, text-only, fast variant
- 지원 언어: English + Korean
- 라이선스: Gemma
- Likes: 57
벤치마크 vs 원본 Gemma 4 26B IT 4-bit
전체 성능
| 항목 | 원본 4-bit | SuperGemma Fast | 델타 |
|---|---|---|---|
| Quick bench overall | 91.4 | 95.8 | +4.4 |
| 평균 생성 속도 | 42.5 tok/s | 46.2 tok/s | +8.7% |
카테고리별 성능
| 카테고리 | 원본 | SuperGemma Fast | 델타 |
|---|---|---|---|
| Code | 92.3 | 98.6 | +6.3 |
| Browser | 87.5 | 89.6 | +2.1 |
| Logic | 86.9 | 95.2 | +8.3 |
| System Design | 97.8 | 98.9 | +1.1 |
| Korean | 90.7 | 95.0 | +4.3 |
왜 주목하는가
- Code +6.3, Logic +8.3: 코딩과 논리 추론에서 원본 대비 큰 폭 향상. 로컬 에이전트 워크로드에 최적
- Korean +4.3: 한국어 프롬프트 처리 능력 향상. 한국어 사용자에게 특히 유용
- 속도 +8.7%: 품질 향상과 동시에 속도까지 개선 (원래는 트레이드오프 관계)
- Uncensored: 검열 없이 코드/브라우저/도구 사용/계획 수행에 강함
- Apple Silicon MLX: Ollama 대신 MLX 직접 구동으로 Apple Silicon 최적화
활용 시나리오
- 로컬 실행 모델로 활용 가능 (기존 gemma4 대체 후보)
- 코드 생성, 브라우저 자동화, 도구 사용, 한국어 에이전트 작업
- Apple Silicon MacBook에서 GPU 없이 고성능 로컬 추론
Related Notes
- moc-ai-models — AI 모델 MOC
- 2026-04-13-claude-code-local-cloud-dichotomy — 로컬-클라우드 이분법 (로컬 모델의 역할)
- 2026-04-13-flash-moe-metal-inference — 순수 C/Metal MoE 추론 (Apple Silicon 최적화 선배 프로젝트)
- moc-ai-coding — AI 코딩 도구 MOC