PDF를 한글(HWP/HWPX)로 변환할 때 표·폰트·서식 깨짐 줄이는 법
공공기관에 제출할 신청서, 학교에서 받은 양식, 협력사에서 넘어온 견적서까지 — 한국에서 일하다 보면 PDF로 받은 문서를 한글(HWP) 형식으로 다시 편집해야 하는 순간이 반복됩니다. 그런데 막상 변환을 시도하면 표가 어긋나고, 한글이 네모(□)로 깨지고, 줄간격이 제멋대로 바뀌어 결국 처음부터 다시 타이핑하는 경우가 많습니다. 이 글은 왜 그런 깨짐이 생기는지 원리부터 짚고, 문서 유형별로 가장 손이 덜 가는 변환 경로를 고르는 법, 그리고 깨진 결과를 빠르게 복구하는 점검 순서까지 실무 관점에서 정리한 가이드입니다.
PDF와 HWP는 애초에 목적이 다른 포맷이다
변환이 까다로운 이유는 도구가 부족해서가 아니라, 두 포맷이 정반대 목적으로 설계됐기 때문입니다. PDF는 '인쇄된 모습을 어떤 환경에서도 똑같이 보여주는 것'이 목표입니다. 그래서 내부적으로 글자 하나하나의 좌표(x, y 위치)와 글꼴 정보를 박제하듯 고정해 둡니다. 우리가 화면에서 보는 '문단'이나 '표'는 사람 눈에만 그렇게 보일 뿐, PDF 입장에서는 특정 좌표에 흩뿌려진 글자 조각들의 모음에 가깝습니다.
반면 HWP/HWPX는 '편집'을 위한 포맷입니다. 문단, 표 셀, 스타일, 글머리표 같은 논리적 구조를 가지고 있어야 커서를 옮기고 글자를 끼워 넣을 수 있습니다. 따라서 PDF를 HWP로 바꾼다는 것은 단순 변환이 아니라, 좌표에 흩어진 글자들을 보고 '여기는 문단이고, 여기는 표의 세 번째 칸이구나'를 역으로 추론해 재구성하는 작업입니다. 이 추론 과정에서 오차가 생기기 때문에 100% 완벽한 자동 변환은 사실상 존재하지 않습니다.
'진짜 텍스트 PDF'와 '스캔 이미지 PDF'를 먼저 구분하라
변환을 시작하기 전에 반드시 확인할 것이 하나 있습니다. 내 PDF가 텍스트를 품고 있는지, 아니면 종이를 스캔한 이미지 덩어리인지입니다. 구분은 간단합니다. PDF 뷰어에서 본문 글자를 마우스로 드래그해 보세요. 글자가 블록으로 선택되면 텍스트 PDF, 사진처럼 통째로만 잡히면 스캔 PDF입니다.
이 차이가 결정적인 이유는, 스캔 PDF에는 글자 데이터가 아예 없기 때문입니다. 이 경우 어떤 변환 도구를 써도 OCR(광학 문자 인식) 단계를 거치지 않으면 한글이 통째로 그림으로 들어가거나 빈 문서가 나옵니다. 스캔본이라면 'OCR 지원'이라고 명시된 도구를 골라야 하고, OCR 정확도는 원본 해상도에 크게 좌우되므로 가능하면 300dpi 이상으로 다시 스캔하는 것이 변환 품질을 가장 크게 끌어올리는 방법입니다.
문서 유형별로 변환 경로를 다르게 골라라
많은 사람이 '제일 좋은 변환기' 하나를 찾으려 하지만, 실무에서 중요한 건 도구가 아니라 경로 선택입니다. 문서의 구성에 따라 최적 경로가 달라집니다.
경로 A — PDF를 Word(DOCX)로 거쳐 한글에서 여는 방법
표와 서식이 섞인 일반적인 업무 문서라면 이 경로가 가장 안정적입니다. PDF를 곧장 HWP로 바꾸는 직변환 도구는 종류가 적고 결과 편차가 큰 반면, PDF→Word 변환은 오래 다듬어진 기술이라 표 구조와 문단을 비교적 잘 살려냅니다. 변환한 DOCX를 한글에서 '불러오기'로 열면 한글이 자체 변환 필터로 HWP 구조에 맞춰 다시 읽어 들입니다. 즉 검증된 두 단계를 이어 붙여 위험을 분산하는 셈입니다. 한글의 DOCX 호환 필터는 워드 표를 한글 표로 옮기는 처리가 꽤 성숙해 있어, 한 번에 직변환하는 것보다 표 정렬이 덜 깨지는 경우가 많습니다.
경로 B — 텍스트만 추출해 새 문서에 붙여넣는 방법
계약서 본문, 회의록, 보고서 서술 부분처럼 표와 그림이 거의 없고 글이 중심인 문서라면 오히려 서식을 버리는 쪽이 깔끔합니다. PDF에서 텍스트만 추출해 한글 새 문서에 붙여넣고, 한글의 스타일 기능으로 제목과 본문을 다시 입히는 방식입니다. 어설프게 보존된 서식을 일일이 걷어내는 것보다, 깨끗한 텍스트에 스타일을 새로 입히는 편이 더 빠르고 결과도 일관됩니다. 다만 PDF의 줄바꿈이 문단 끝이 아니라 단순 행바꿈인 경우가 많아, 붙여넣은 뒤 불필요한 줄바꿈을 정리하는 후처리는 필요합니다.
웹 도구 · 한글 정품 · 명령줄, 무엇을 쓸까
한글(한컴오피스) 정품을 쓰고 있다면 사실 PDF를 직접 '불러오기'하는 기능이 내장돼 있습니다. 폐쇄망이나 보안이 중요한 환경에서는 파일을 외부로 보내지 않는 이 방식이 가장 안전합니다. 정품이 없거나 가끔 한 번 변환하는 정도라면 웹 변환 도구가 설치 없이 빠릅니다. 수십, 수백 개 문서를 일괄 처리해야 한다면 LibreOffice의 명령줄 변환 같은 자동화 수단이 효율적입니다. 결국 '보안·빈도·물량'이라는 세 축으로 판단하면 됩니다.
# LibreOffice로 여러 PDF를 한 번에 DOCX로 일괄 변환 (이후 한글에서 HWP 저장)
for f in *.pdf; do
soffice --headless --convert-to docx --outdir ./out "$f"
done가장 흔한 깨짐 세 가지와 해결법
변환 후 문제는 대개 정해진 몇 가지 패턴으로 나타납니다. 원인을 알면 대응도 빨라집니다.
한글이 네모(□)나 빈칸으로 보이는 폰트 문제
가장 자주 겪는 현상입니다. 원인은 보통 둘 중 하나입니다. 첫째, PDF에 글꼴이 '부분 포함(서브셋)'돼 있어 변환 과정에서 글자 일부가 유실되는 경우. 둘째, 변환 결과가 내 PC에 없는 한글 글꼴(예: 특정 정부 기관 전용 폰트)을 지정하고 있어 대체 글꼴이 깨져 보이는 경우입니다. 해결은 변환 후 문서 전체를 선택해 '맑은 고딕', '함초롬바탕' 같이 시스템에 확실히 설치된 글꼴로 일괄 변경하는 것입니다. 함초롬 글꼴은 한컴에서 무료로 배포하므로 한글 문서 호환성을 위해 설치해 두면 이런 문제를 크게 줄일 수 있습니다.
표가 어긋나거나 셀이 합쳐지는 문제
PDF의 표는 사실 '줄(선)'과 '글자'가 따로 그려진 것이라, 변환기가 셀 경계를 잘못 추론하면 칸이 밀리거나 병합됩니다. 특히 셀 안에서 줄바꿈이 일어난 표, 테두리 선이 없는 표가 취약합니다. 이때는 무리하게 자동 변환된 표를 살리기보다, 한글에서 원하는 행·열 크기의 빈 표를 새로 만들고 셀 내용만 옮겨 담는 편이 결국 더 빠릅니다. 원본 PDF를 옆 화면에 띄워 두고 대조하면 누락을 막을 수 있습니다.
줄간격·들여쓰기가 들쭉날쭉한 문제
PDF는 줄 위치를 좌표로 고정하기 때문에, 변환되면 문단마다 제각각인 줄간격과 어색한 들여쓰기가 따라옵니다. 일일이 손보지 말고 한글의 '문단 모양'에서 줄간격을 일괄 지정하거나, 스타일을 새로 적용해 한 번에 정리하는 것이 정석입니다. 본문 전체에 동일한 스타일을 입히면 들쭉날쭉하던 간격이 한 번에 정렬됩니다.
변환을 마쳤다면 이 순서로 점검하라
눈에 보이는 레이아웃만 보고 '잘 됐다'고 넘기면, 정작 인쇄하거나 제출할 때 문제가 드러납니다. 다음 순서로 빠르게 훑으면 대부분의 사고를 예방할 수 있습니다.
- 글꼴 깨짐: 문서를 끝까지 스크롤하며 네모(□)나 빈칸으로 표시된 글자가 없는지 확인합니다.
- 표 정합성: 모든 표의 행·열 수와 셀 내용이 원본과 일치하는지, 병합된 셀이 풀리지 않았는지 봅니다.
- 숫자와 단위: 금액·날짜·전화번호처럼 OCR이나 변환에서 자주 틀리는 항목을 원본과 대조합니다.
- 줄바꿈: 한 문단이 여러 줄로 쪼개졌거나, 반대로 두 문단이 붙지 않았는지 확인합니다.
- 페이지 구성: 머리말·꼬리말·쪽번호가 중복되거나 본문에 섞여 들어오지 않았는지 봅니다.
- 최종 저장: 편집 후 HWPX(개방형 표준)로도 한 부 저장해 두면 장기 보관과 다른 프로그램 호환에 유리합니다.
보안과 개인정보, 잊지 말 것
마지막으로 자주 간과되는 부분입니다. 주민등록번호, 계좌번호, 인사 정보가 담긴 문서를 변환할 때는 도구의 처리 방식을 확인해야 합니다. 웹 변환 서비스라면 업로드한 파일을 언제 삭제하는지, 서버에 남기는지 정책을 살펴보고, 민감 문서는 가급적 PC에 설치된 한글이나 LibreOffice처럼 외부로 파일이 나가지 않는 로컬 도구로 처리하는 것이 안전합니다. 공공기관 제출용 문서라면 변환 후 다시 PDF로 내보낼 때 개인정보가 메타데이터에 남지 않는지도 함께 점검하면 좋습니다. 변환은 수단일 뿐, 최종 목표는 정확하고 안전하게 편집 가능한 문서를 얻는 것임을 기억하면 도구 선택과 검수 기준이 한결 분명해집니다.