hwp-mcp — 한글(HWP/HWPX) 파일 파싱 MCP 서버

HWP, HWPX 파일의 텍스트를 파싱, 표와 이미지까지 추출하는 MCP 서버


기능

파일 지원

포멧설명
HWP한글 97/2007/2010/2014/2018 포멧
HWPX한글 2010 이후 XML 포멧

추출 가능한 데이터

  • 텍스트 — 문서 전체 텍스트
  • — 문서 내 모든 테이블
  • 이미지 — 문서 내 포함된 이미지

제한 사항

  • 문서 생성 불가 — 새로운 HWP/HWPX 파일 생성은 지원하지 않음
  • 읽기 전용 — 기존 파일의 내용을 파싱하는 것만 가능

활용 방법

기본 사용

# 기존 HWP 파일 텍스트 파싱
hwp.read("document.hwp")
 
# HWPX 파일 텍스트 파싱
hwp.read("document.hwpx")
 
# 테이블 추출
hwp.extract_tables("document.hwp")
 
# 이미지 추출
hwp.extract_images("document.hwp")

템플릿 채우기

# 템플릿 파일 로드
template = hwp.read_template("template.hwp")
 
# 변수 채우기
template.fill({
    "회사명": "트리소",
    "이름": "홍길동",
    "날짜": "2026-03-31"
})
 
# 저장 (HWP 포멧으로 내보내기)
template.save("output.hwp")

설치

MCP 서버 설치

claude mcp add hwp-mcp -- uvx --from hwp-mcp hwp-mcp

지원 플랫폼

  • Claude Code
  • Claude Desktop
  • VS Code Copilot
  • Cursor
  • ChatGPT
  • (MCP 지원하는 어디서든 동작)

호환성

운영체제

OS지원 여부한글 프로그램 필요
macOS❌ 불필요
Windows❌ 불필요

특징

  • macOS, 윈도우 모두 지원 — 한글 프로그램 설치 없이
  • 맥/윈도우 양쪽 — 이식 플랫폼에서 모두 사용 가능
  • 경량 — 별도의 한글 프로그램 설치 불필요

GitHub

리포지토리: https://github.com/treesoophwp/hwp-mcp


출처


활용 사례

1. 문서 분석

한글로 작성된 보고서, 계약서, 제안서 등의 내용을 AI가 이해하고 분석 가능

2. 템플릿 자동화

회사 서식, 계약서 템플릿 등에 데이터를 자동으로 채워 넣기 가능

3. 다국어 번역 준비

한글 문서 텍스트를 추출해서 번역 AI에 입력 가능

4. 문서 검색

HWP 문서 텍스트를 인덱싱해서 검색 엔진에서 검색 가능


관련 도구

  • defuddle — 웹 페이지 텍스트 파싱
  • OpenDataLoader PDF — PDF 텍스트/데이터 로딩

Added: 2026-03-31