LLM Wiki

❯

❯

Qwen

2026년 5월 05일2 min read

entity
ai-models
qwen
alibaba
open-source
local-inference

Qwen

Alibaba의 오픈소스 LLM 패밀리. 작은 사이즈에서도 강력한 성능을 보여주며, 로컬 추론에 특히 적합하다.

주요 버전

Qwen 3.5 9B: 8GB VRAM에서도 구동 가능한 실용적인 사이즈, quant 버전으로 로컬 에이전트에 활용
Qwen 3.6 27B: 오픈소스 에이전틱 코딩에 강점
Qwen 3.6 35B-A3B: MoE 구조

실제 사용 사례

@vmiss33은 RTX 4070 8GB 노트북에서 Qwen 3.5 9B quant(64k context)를 llama.cpp로 서빙하여 Lifestyle/Research Agent를 구동. M1 MacBook 16GB RAM에서도 동일 모델 구동 가능.

크로스 레퍼런스

2026-05-02-qwen3.5-9b-deepseek-v4-flash-model-comparison — Qwen 3.5 9B vs DeepSeek v4 Flash 비교
2026-04-22-qwen3-6-27b-open-source-agentic-coding — Qwen 3.6 27B 오픈소스 에이전틱 코딩
2026-04-16-qwen3-6-35b-a3b-open-to-all — Qwen 3.6 35B-A3B
2026-04-17-qwen3-6-35b-a3b-mlx-macbook-local — Qwen 3.6 35B-A3B MacBook 로컬 구동
llama-cpp — llama.cpp 로컬 추론 엔진
lmstudio — LM Studio 로컬 추론 도구

그래프 뷰

Qwen
주요 버전
실제 사용 사례
크로스 레퍼런스

백링크

llama.cpp
LM Studio
index
Hermes Agent 활용 사례와 나만의 사용법 (@vmiss33)

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community