SuperGemma4 - 구글 Gemma 4 26B의 비검열/속도개선/양자화 모델

Gemma 4 26B 기반의 비검열·고속·양자화 모델을 소개한 GeekNews 글로, 코드 생성과 한국어 프롬프트 성능 향상, MLX 4-bit 서빙 정보를 함께 다룬다.

개요

이 글은 Hugging Face의 Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2를 소개하는 GeekNews 보도다. 핵심은 Gemma 4 26B IT를 기반으로 한 언센서드 모델이 코드/논리/한국어 영역에서 원본보다 더 나은 수치를 보이고, Apple Silicon MLX 4-bit 서빙으로 로컬 활용이 쉽다는 점이다.

이 노트는 단순 모델 소개를 넘어서, 실제로 로컬 에이전트 워크로드에 어떤 의미가 있는지와 기존의 2026-04-13-supergemma4-26b-uncensored-mlx 모델 노트와 어떻게 이어지는지를 보관한다.

핵심 포인트

  • Code score 98.6, 원본 대비 +6.3
  • Korean score 95.0, 원본 대비 +4.3
  • 평균 속도 46.2 tok/s, 원본 대비 +8.7%
  • 비검열 특성 유지
  • MLX 4-bit로 Apple Silicon에서 로컬 실행 가능
  • OpenAI 호환 서빙을 바로 쓸 수 있어 실험 장벽이 낮음

왜 중요한가

이 글은 단순히 “좋은 모델이 나왔다” 수준이 아니라, Gemma 4 계열이 한국어·코드·도구 사용 환경에서 실용적으로 쓸 만한 로컬 옵션이 되었음을 보여준다. 로컬 추론, 브라우저 자동화, Claude Code 대체/보조 모델 구성에 직접 연결된다.

Sources