한글과컴퓨터의 한/글 문서 파일(.hwp)을 읽고 파싱하는 라이브러리입니다.
본 제품은 한글과컴퓨터의 한/글 문서 파일(.hwp) 공개 문서를 참고하여 개발하였습니다. 공개 문서 다운로드
- JSON 변환: HWP 문서 구조를 JSON으로 추출
- Markdown 변환: 텍스트, 테이블, 이미지를 포함한 Markdown 변환
- HTML 변환: CSS 스타일링이 적용된 완전한 HTML 문서 생성
- CLI 도구: 단일 파일 변환, 배치 처리, 이미지 추출
- 멀티 플랫폼: Node.js, Web(WASM), React Native 지원
이 프로젝트는 Bun 워크스페이스를 사용한 모노레포 구조입니다.
hwpjs/
├── crates/
│ └── hwp-core/ # 공유 Rust 라이브러리 (핵심 HWP 파싱 로직)
├── packages/
│ └── hwpjs/ # 멀티 플랫폼 패키지 (Node.js, Web, React Native)
├── examples/ # 사용 예제
│ ├── node/ # Node.js 예제
│ ├── web/ # Web 예제 (React + Vite)
│ ├── react-native/ # React Native 예제
│ └── cli/ # CLI 사용 예제
├── documents/ # 문서 사이트 (Rspress)
└── e2e/ # E2E 테스트 (Playwright)
- Rust: 핵심 파싱/변환 로직
- NAPI-RS: Node.js 네이티브 모듈
- Craby: React Native 바인딩
- Bun: 워크스페이스 관리
- Rspress: 문서 사이트
npm install @ohah/hwpjsimport { toJson, toMarkdown, toHtml, fileHeader } from '@ohah/hwpjs';
import { readFileSync } from 'fs';
const data = readFileSync('./document.hwp');
// JSON 변환
const json = toJson(data);
// Markdown 변환
const { markdown, images } = toMarkdown(data, {
image: 'base64',
useHtml: true,
});
// HTML 변환
const html = toHtml(data, {
includeVersion: true,
});
// 파일 헤더 추출
const header = fileHeader(data);# 전역 설치
npm install -g @ohah/hwpjs
# JSON 변환
hwpjs to-json document.hwp -o output.json --pretty
# Markdown 변환
hwpjs to-markdown document.hwp -o output.md --include-images
# HTML 변환
hwpjs to-html document.hwp -o output.html
# 파일 정보 확인
hwpjs info document.hwp
# 이미지 추출
hwpjs extract-images document.hwp -o ./images
# 배치 변환
hwpjs batch ./documents -o ./output --format json --recursive더 자세한 내용은 CLI 가이드를 참고하세요.
mise(미즈)를 사용하여 필요한 도구를 설치합니다:
mise installbun run test:rust- Rust 테스트 실행bun run test:node- Node.js 테스트 실행bun run dev:docs- 문서 사이트 개발 서버bun run dev:web- Web 예제 개발 서버bun run lint- 린트 검사bun run format- 코드 포맷팅bun run build- 전체 빌드
해당 깃허브에 남겨주세요.
이 프로젝트는 MIT 라이센스를 따릅니다.