Overview
DOCX는 Microsoft Word의 기본 문서 형식이자, 전 세계에서 가장 많이 사용되는 워드프로세서 형식입니다. Office Open XML(OOXML) 표준을 기반으로 하며, XML 파일과 미디어 에셋을 ZIP으로 묶어 저장합니다.
DOCX는 서식, 이미지, 표, 머리글/바닥글, 각주 등이 포함된 리치 텍스트 문서를 작성·편집하기 위한 형식으로, 대부분의 문서가 최종적으로 PDF로 변환되기 전 DOCX에서 출발합니다.
History
Microsoft는 이진 .doc 형식을 대체하기 위해 Office 2007에서 DOCX를 도입했습니다. 기반이 되는 Office Open XML 사양은 2006년 ECMA-376으로, 2008년 ISO/IEC 29500으로 각각 표준화되었습니다.
XML 기반 형식으로의 전환은 상호운용성, 투명성, 장기 보존에 대한 요구에서 비롯되었습니다. 현재 DOCX는 Microsoft Word, Google Docs, LibreOffice, Apple Pages를 비롯한 수많은 애플리케이션에서 지원됩니다.
Technical Details
DOCX 파일은 디렉터리 구조로 정리된 XML 파일들의 ZIP 아카이브입니다. 본문 내용은 word/document.xml에, 스타일은 word/styles.xml에, 관계 정보는 word/_rels/document.xml.rels에, 미디어 파일은 word/media/에 위치합니다.
XML 마크업은 w:(WordprocessingML), r:(relationships), a:(DrawingML) 등의 네임스페이스를 사용합니다. 텍스트는 단락(<w:p>) 안의 런(<w:r>)으로 구성되며, 런 속성(<w:rPr>)과 텍스트 노드(<w:t>)를 포함합니다.
DOCX는 테마, 임베디드 폰트, 변경 내용 추적, 주석, 양식 필드, 콘텐츠 컨트롤, SmartArt, OLE 개체를 지원합니다.
Pros & Cons
Pros
- 주요 워드프로세서에서 보편적으로 편집 가능
- 풍부한 서식, 스타일, 템플릿 기능
- 문서화된 XML 스키마의 개방형 표준 (ISO/IEC 29500)
- 변경 내용 추적 및 협업 편집 기능
- PDF를 비롯한 다른 형식으로 손쉽게 변환 가능
Cons
- 에디터에 따라 서식이 달라질 수 있음 (Word vs. LibreOffice 등)
- 고정 레이아웃 배포 용도로는 부적합 (PDF를 사용해야 함)
- 복잡한 XML 구조라 프로그래밍으로 파싱하기 까다로움
- 이미지가 많은 대용량 문서는 파일 크기가 커짐
Common Use Cases
- 비즈니스 보고서 및 제안서
- 학술 논문 및 졸업 논문
- 편지, 이력서, 자기소개서
- 변경 내용 추적이 필요한 협업 문서
- 반복 생성되는 문서의 템플릿