PDF 용량이 중요한 이유
PDF 용량이 크면 불편이 쌓입니다. 이메일 첨부 파일은 보통 25MB 제한이 있고, 웹 포털 업로드는 타임아웃이 걸리고, 느린 네트워크 환경에서 50MB짜리 파일을 공유하면 양쪽 모두 답답합니다. 웹사이트에 PDF를 올려두는 경우, 파일이 크면 페이지 로딩 속도와 검색엔진 순위에도 악영향을 줍니다.
다행히 대부분의 PDF에는 줄일 수 있는 여지가 상당합니다. 20MB 파일이 3MB까지 줄어드는 경우도 흔하며, 눈으로 구분할 수 없을 정도로 품질이 유지되는 경우가 많습니다. 핵심은 파일이 왜 큰지를 파악하고, 상황에 맞는 압축 전략을 선택하는 것입니다.
방법 1: 이미지 압축
PDF 용량의 가장 큰 비중을 차지하는 것은 이미지입니다. 고해상도 사진 몇 장만 포함되어 있어도 텍스트와 무관하게 수십 MB에 달하기 쉽습니다.
가장 효과적인 접근은 이미지를 실제 표시 크기에 맞춰 리샘플링하는 것입니다. 페이지에서 3인치 너비로 표시되는 이미지에 4000픽셀 해상도는 필요 없습니다. 인쇄용이라면 300DPI(900픽셀), 화면용이라면 150DPI로 충분합니다.
압축 알고리즘 선택도 중요합니다. 사진에는 JPEG 압축이 효율적이고, 차트나 스크린샷처럼 선명한 경계가 중요한 그래픽에는 무손실 압축이 더 적합합니다.
JPEG 품질을 100 기준으로 75~80 정도로 설정하면 육안으로 차이를 느끼기 어려우면서 파일 크기를 60~70% 줄일 수 있습니다.
방법 2: 사용하지 않는 객체 제거
PDF는 편집을 거듭할수록 불필요한 데이터가 쌓입니다. 페이지를 삭제하거나 이미지를 교체해도, 기존 데이터가 파일 안에 참조되지 않는 객체로 남아 있는 경우가 많습니다. PDF 편집기가 파일 전체를 다시 쓰는 대신 변경 사항만 덧붙이는 방식(증분 저장)을 사용하기 때문입니다.
"다른 이름으로 저장"이나 "최적화" 기능을 실행하면 파일을 처음부터 다시 구성하면서 고아 객체를 제거합니다. 여러 번 편집된 문서라면 이것만으로도 용량이 절반 이하로 줄어들 수 있습니다.
메타데이터도 의외의 용량 차지합니다. 일부 PDF에는 방대한 XML 메타데이터, 모든 페이지의 미리보기 썸네일, 제작 소프트웨어가 남긴 고유 데이터가 들어 있습니다. 불필요한 메타데이터를 제거해도 문서 내용에는 영향이 없으면서 공간을 확보할 수 있습니다.
방법 3: 해상도를 전략적으로 낮추기
PDF의 모든 페이지가 같은 해상도일 필요는 없습니다. 표지의 전면 사진은 300DPI가 적절하지만, 본문 속 작은 썸네일 이미지는 150DPI로도 충분합니다.
이미 목표 해상도 이하인 이미지는 건드리지 않는 것이 좋습니다. 다시 인코딩하면 품질만 떨어지고 용량은 줄지 않습니다.
화면 전용 문서라면 96~150DPI, 인쇄 가능성이 있다면 200~300DPI가 적절합니다. 300DPI를 넘기면 고급 프린터에서도 눈에 보이는 차이가 거의 없습니다.
방법 4: 글꼴 서브세팅과 최적화
글꼴은 생각보다 용량이 큽니다. 한중일(CJK) 글꼴은 하나에 15MB를 넘기기도 합니다. 문서에서 실제로 사용한 글자가 수십 개뿐이라면, 전체 글꼴을 내장하는 것은 엄청난 낭비입니다.
글꼴 서브세팅은 문서에 실제 사용된 글자의 외곽선만 포함시키는 기법입니다. 15MB 글꼴이라도 사용 글자가 50개뿐이라면 50KB 수준으로 줄어듭니다.
여러 문서를 합쳐서 만든 PDF에는 같은 글꼴이 이름만 약간 달리해서 중복 내장된 경우도 있습니다. 중복 글꼴을 하나로 합치는 것도 효과적인 최적화입니다.
Arial, Times New Roman 같은 시스템 기본 글꼴만 사용했다면, 글꼴을 내장하지 않고 이름만 참조하는 방법도 있습니다. 다만 해당 글꼴이 없는 환경에서는 표시가 약간 달라질 수 있다는 점은 감안해야 합니다.
방법 5: 웹 최적화(리니어라이제이션)
리니어라이제이션은 "빠른 웹 보기"라고도 불리며, PDF 내부 구조를 재배치해서 브라우저가 파일 전체를 다운로드하기 전에 첫 페이지부터 표시할 수 있게 합니다. 실제 파일 크기가 크게 줄지는 않지만, 온라인에서 PDF를 열 때 체감 로딩 속도가 크게 빨라집니다.
리니어라이즈된 PDF는 1페이지에 필요한 리소스를 파일 앞부분에, 이후 페이지를 순서대로 배치합니다. 100페이지짜리 PDF 링크를 클릭하면 전체 다운로드를 기다리지 않고 첫 페이지를 즉시 볼 수 있습니다.
상황에 맞는 방법 선택
최적의 접근은 PDF의 특성에 따라 달라집니다. 사진이 많은 문서라면 이미지 압축이 가장 효과적이고, 워드프로세서로 만든 텍스트 문서라면 불필요한 객체 제거와 글꼴 최적화가 더 큰 효과를 냅니다. 여러 차례 편집을 거친 파일이라면 "다른 이름으로 저장"만으로도 충분할 수 있습니다.
대부분의 경우 여러 방법을 조합하면 최상의 결과를 얻을 수 있습니다. 불필요한 객체를 먼저 제거하고, 이미지를 압축한 다음, 글꼴을 서브세팅하세요. 최적화된 파일을 배포하기 전에 품질이 만족스러운지 꼭 확인하시고, 원본 파일은 반드시 보관해 두세요. 손실 압축은 되돌릴 수 없으니까요.