작업별 맞춤 하네스: Claude Code의 동적 워크플로우
GeekNews 토픽 https://news.hada.io/topic?id=30136에 올라온 Claude 공식 글 요약. 원문은 https://claude.com/blog/a-harness-for-every-task-dynamic-workflows-in-claude-code입니다. 이 글은 claude-code가 작업별로 자체 하네스를 생성·조율하는 방식과, 그걸 언제 써야 하는지를 정리합니다.
한눈에 보는 요약
Claude Code는 이제 단일 harness로 끝나는 도구가 아니라, 작업에 맞는 하네스를 즉석에서 생성·오케스트레이션하는 시스템이 됩니다. 핵심은 하네스를 고정된 템플릿으로 두지 않고, 작업의 구조에 맞춰 서브에이전트·모델·격리(worktree)·검증 루프를 조합하는 데 있습니다.
이 방식은 특히 긴 작업, 대규모 병렬 처리, 다단계 검증, 대립적 리뷰, 루프형 탐색처럼 사람이 한 번에 붙들기 어려운 문제에서 강합니다. 반대로, 일반적인 코딩처럼 단순하고 짧은 작업에는 과한 경우가 많습니다.
핵심 포인트
- Claude Code가 JavaScript 기반 workflow/harness를 직접 작성하고 실행할 수 있다.
- 서브에이전트를 여러 개 띄워 분할 → 검증 → 합성하는 구조가 핵심이다.
- 모델 선택과 worktree 분리는 작업의 난이도와 격리 수준에 맞춰 동적으로 바꿀 수 있다.
- 중단되면 세션을 재개해 이어서 돌릴 수 있어 장기 작업에 맞다.
- 다만 token 비용이 커질 수 있어, 고가치·복잡한 작업에 쓰는 편이 낫다.
글에서 제안하는 대표 패턴
1) 분류 후 실행
먼저 작업 유형을 분류하고, 그 결과에 따라 다른 에이전트나 다른 행동으로 라우팅합니다. 예를 들면 보안 분석, 리서치, 코드 리뷰, 변경 적용을 서로 다른 흐름으로 분기할 수 있습니다.
2) Fan-out → Synthesize
작업을 여러 조각으로 나눈 뒤 병렬 서브에이전트에 분배하고, 마지막에 합성합니다. 대량의 작은 작업이나 서로 간섭하면 안 되는 작업에 적합합니다.
3) Adversarial verification
생성한 결과를 다른 에이전트가 반박·검증하게 만듭니다. “내 결과를 내가 믿는” 편향을 줄이는 데 유용합니다.
4) Generate → Filter
많이 만든 다음, rubric이나 검증으로 거릅니다. 아이디어 탐색, 네이밍, 후보 선별에 잘 맞습니다.
5) Tournament
여러 에이전트가 같은 문제를 서로 다른 접근으로 풀고, 비교 평가로 승자를 고릅니다. 절대 점수보다 상대 비교가 더 믿을 만할 때 좋습니다.
6) Loop until done
끝나는 조건이 불명확한 작업은, 고정 횟수가 아니라 조건 만족 시까지 반복합니다. triage나 탐색형 리서치에 맞습니다.
언제 쓰면 좋은가
- 실패가 재현되지 않는 간헐적 버그를 복제할 때
- 최근 세션들을 훑어 반복되는 교정 포인트를 규칙으로 만들 때
- Slack/이슈/로그에서 반복 원인을 찾아낼 때
- 투자자/고객/경쟁자 관점으로 사업안을 검증할 때
- 대량 이력서, 대량 티켓, 대량 문서의 분류·순위화가 필요할 때
- 코드베이스 리팩터링, 기술 검증, 보안 분석, 심층 리서치처럼 검증이 중요한 작업일 때
언제 안 쓰는가
- 평범한 단일 파일 수정
- 짧고 명확한 코딩 작업
- 여러 에이전트를 붙일 만큼 복잡하지 않은 작업
이 글의 의미
이 글은 harness를 모델 바깥의 보조 도구가 아니라, 작업을 수행하는 핵심 시스템 층으로 봐야 한다는 점을 강조합니다. Claude Code는 그 위에서 동적으로 하네스를 생성하는 쪽으로 진화하고 있고, 그래서 “도구를 쓰는 법”보다 “작업을 어떤 구조로 분해할 것인가”가 더 중요해졌습니다.