Qwen3.6-35B-A3B 공개 — 오픈웨이트 에이전틱 코딩 모델

Qwen이 35B total / 3B active 구조의 오픈웨이트 MoE 모델을 공개하면서, agentic coding 성능과 Anthropic API 호환성을 동시에 전면에 내세웠다. 이는 공개 모델이 moc-claude-code·openclaw 계열 워크플로에 바로 투입될 수 있음을 뜻한다.

개요

2026-04-16 GeekNews 항목은 Qwen3.6-35B-A3B를 “Agentic Coding Power, Now Open to All”이라는 문구 그대로 소개한다. GeekNews 한국어 요약과 Qwen 공식 블로그를 합치면, 이 모델의 핵심은 단순히 멀티모달 오픈웨이트 모델이 아니라, 35B total / 3B active의 MoE 구조로 큰 dense 모델에 준하는 에이전틱 코딩 성능을 더 낮은 운영 비용으로 제공한다는 데 있다.

Qwen 공식 발표는 이 모델이 Qwen Studio, 오픈 웨이트, 추후 API 경로를 동시에 갖고 있으며, multimodal thinking / non-thinking 모드, preserve_thinking, Anthropic API 프로토콜 호환성까지 제공한다고 설명한다. 따라서 이 항목은 단순 모델 출시가 아니라, 공개 모델이 상용 코딩 에이전트 툴체인에 직접 진입하는 사건으로 읽는 편이 맞다.

핵심 포인트

  • Qwen3.6-35B-A3B는 35B total / 3B active 파라미터의 sparse MoE 구조다.
  • 공식 비교표 기준으로 SWE-bench Verified 73.4, Terminal-Bench 2.0 51.5, Claw-Eval Avg 68.7, NL2Repo 29.4, QwenWebBench 1397을 기록했다.
  • GeekNews는 Qwen3.5-35B-A3B 대비 agentic coding 성능 향상, Gemma4-26B-A4B 대비 우세, Claude Sonnet 4.5보다 강한 일부 멀티모달 지표를 강조했다.
  • Qwen 공식 블로그는 이 모델을 오픈웨이트와 Qwen Studio 양쪽에 동시에 배치하며, API도 coming soon이라고 밝혔다.
  • preserve_thinking은 다중 턴 에이전트 작업에서 이전 추론 상태를 유지해 장기 맥락 손실을 줄이려는 기능으로 읽힌다.
  • Anthropic API 프로토콜 호환성 언급은 이 모델이 moc-claude-code 스타일 도구나 openclaw 같은 멀티에이전트 환경에 더 쉽게 편입될 수 있음을 시사한다.
  • 단, 범용 에이전트 작업(VITA-Bench 35.6)과 최고난도 추론(HLE 21.4)에서는 더 큰 dense 계열에 아직 약점이 남아 있다.

왜 중요한가

이 항목이 ai-agents로 분류된 이유는 모델 자체의 절대 성능보다, “오픈웨이트 모델이 에이전트 런타임에 바로 들어갈 수 있는가”를 전면에 다루기 때문이다. Qwen 팀은 벤치마크를 일반 챗봇식 성능보다 SWE-bench, Terminal-Bench, Claw-Eval, WebBench처럼 실제 툴 사용과 장기 실행이 들어간 지표로 구성했고, 동시에 Anthropic API 프로토콜 호환까지 언급했다. 즉 모델이 곧바로 에이전트 하네스의 부품으로 소비되는 시대라는 뜻이다.

또한 이 노트는 2026-04-16-qwen3-6-35b-a3b의 Hugging Face 카드 메모를 보완한다. 기존 노트가 모델 카드 기반의 정적 특성 정리였다면, 이번 GeekNews 항목은 왜 이 모델이 오픈소스 코딩 에이전트 생태계에서 의미 있는지, 그리고 왜 2026-04-08-openclaw-opus-alternative-qwen 같은 대안 런타임 서사와 이어지는지를 더 분명하게 보여준다.

Sources