SuperGemma4-26B-Uncensored-Fast v2 — Apple Silicon MLX 최적화

Gemma 4 26B IT 기반, 언센서드+속도 튜닝, Apple Silicon MLX 4-bit 양자화. Quick bench +4.4, 속도 +8.7%.

개요

Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2는 Gemma 4 26B IT를 기반으로 한 텍스트 전용(text-only) 언센서드 파인튠이다. Apple Silicon의 MLX 프레임워크에 최적화된 4-bit 양자화 모델로, 로컬 에이전트 워크로드에 특화되어 있다.

  • 베이스: Gemma 4 26B IT
  • 양자화: 4-bit (MLX)
  • 특성: uncensored, text-only, fast variant
  • 지원 언어: English + Korean
  • 라이선스: Gemma
  • Likes: 57

벤치마크 vs 원본 Gemma 4 26B IT 4-bit

전체 성능

항목원본 4-bitSuperGemma Fast델타
Quick bench overall91.495.8+4.4
평균 생성 속도42.5 tok/s46.2 tok/s+8.7%

카테고리별 성능

카테고리원본SuperGemma Fast델타
Code92.398.6+6.3
Browser87.589.6+2.1
Logic86.995.2+8.3
System Design97.898.9+1.1
Korean90.795.0+4.3

왜 주목하는가

  • Code +6.3, Logic +8.3: 코딩과 논리 추론에서 원본 대비 큰 폭 향상. 로컬 에이전트 워크로드에 최적
  • Korean +4.3: 한국어 프롬프트 처리 능력 향상. 한국어 사용자에게 특히 유용
  • 속도 +8.7%: 품질 향상과 동시에 속도까지 개선 (원래는 트레이드오프 관계)
  • Uncensored: 검열 없이 코드/브라우저/도구 사용/계획 수행에 강함
  • Apple Silicon MLX: Ollama 대신 MLX 직접 구동으로 Apple Silicon 최적화

활용 시나리오

  • 로컬 실행 모델로 활용 가능 (기존 gemma4 대체 후보)
  • 코드 생성, 브라우저 자동화, 도구 사용, 한국어 에이전트 작업
  • Apple Silicon MacBook에서 GPU 없이 고성능 로컬 추론