SuperGemma4-26B-Uncensored-Fast v2 — Apple Silicon MLX 최적화

Gemma 4 26B IT 기반, 언센서드+속도 튜닝, Apple Silicon MLX 4-bit 양자화. Quick bench +4.4, 속도 +8.7%.

개요

Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2는 Gemma 4 26B IT를 기반으로 한 텍스트 전용(text-only) 언센서드 파인튠이다. Apple Silicon의 MLX 프레임워크에 최적화된 4-bit 양자화 모델로, 로컬 에이전트 워크로드에 특화되어 있다.

베이스: Gemma 4 26B IT
양자화: 4-bit (MLX)
특성: uncensored, text-only, fast variant
지원 언어: English + Korean
라이선스: Gemma
Likes: 57

벤치마크 vs 원본 Gemma 4 26B IT 4-bit

전체 성능

항목	원본 4-bit	SuperGemma Fast	델타
Quick bench overall	91.4	95.8	+4.4
평균 생성 속도	42.5 tok/s	46.2 tok/s	+8.7%

카테고리별 성능

카테고리	원본	SuperGemma Fast	델타
Code	92.3	98.6	+6.3
Browser	87.5	89.6	+2.1
Logic	86.9	95.2	+8.3
System Design	97.8	98.9	+1.1
Korean	90.7	95.0	+4.3

왜 주목하는가

Code +6.3, Logic +8.3: 코딩과 논리 추론에서 원본 대비 큰 폭 향상. 로컬 에이전트 워크로드에 최적
Korean +4.3: 한국어 프롬프트 처리 능력 향상. 한국어 사용자에게 특히 유용
속도 +8.7%: 품질 향상과 동시에 속도까지 개선 (원래는 트레이드오프 관계)
Uncensored: 검열 없이 코드/브라우저/도구 사용/계획 수행에 강함
Apple Silicon MLX: Ollama 대신 MLX 직접 구동으로 Apple Silicon 최적화

활용 시나리오

로컬 실행 모델로 활용 가능 (기존 gemma4 대체 후보)
코드 생성, 브라우저 자동화, 도구 사용, 한국어 에이전트 작업
Apple Silicon MacBook에서 GPU 없이 고성능 로컬 추론

moc-ai-models — AI 모델 MOC
2026-04-13-claude-code-local-cloud-dichotomy — 로컬-클라우드 이분법 (로컬 모델의 역할)
2026-04-13-flash-moe-metal-inference — 순수 C/Metal MoE 추론 (Apple Silicon 최적화 선배 프로젝트)
moc-ai-coding — AI 코딩 도구 MOC

LLM Wiki

탐색기

SuperGemma4-26B-Uncensored-Fast v2 — Apple Silicon MLX 최적화 Gemma4

SuperGemma4-26B-Uncensored-Fast v2 — Apple Silicon MLX 최적화

개요

벤치마크 vs 원본 Gemma 4 26B IT 4-bit

전체 성능

카테고리별 성능

왜 주목하는가

활용 시나리오

그래프 뷰

목차

백링크

LLM Wiki

탐색기

SuperGemma4-26B-Uncensored-Fast v2 — Apple Silicon MLX 최적화 Gemma4

SuperGemma4-26B-Uncensored-Fast v2 — Apple Silicon MLX 최적화

개요

벤치마크 vs 원본 Gemma 4 26B IT 4-bit

전체 성능

카테고리별 성능

왜 주목하는가

활용 시나리오

Related Notes

그래프 뷰

목차

백링크