Converdoc

PDF에서 텍스트 추출하기

Extract Text from PDF

Converdoc는 텍스트 기반 PDF에 들어 있는 실제 텍스트 레이어를 읽어 편집 가능한 .txt 파일로 뽑아냅니다. 워드나 한글로 만들어 PDF로 저장한 문서, 디지털 보고서, 전자책처럼 글자를 드래그해 선택할 수 있는 PDF에 가장 잘 맞습니다. 종이를 사진·스캔한 PDF는 글자가 이미지로 되어 있어 이 도구로는 추출되지 않으니 OCR 도구가 필요합니다.

Converdoc reads the actual text layer inside a text-based PDF and pulls it out into an editable .txt file. It works best on PDFs that were created digitally — documents exported from Word, digital reports, ebooks — where you can already select and copy the text. Scanned or photographed PDFs store text as images, so they won't extract here and need an OCR tool instead.

PDF에서 텍스트 추출하기 — 브라우저에서 바로 처리하는 무료 도구입니다. 아래에 파일을 올리면 변환이 시작되며, 파일은 서버로 업로드되지 않습니다.

Extract Text from PDF — a free tool that runs right in your browser. Add your files below and the conversion starts; nothing is uploaded.

변환 도구가 곧 여기에 나타납니다. 보이지 않으면 브라우저에서 JavaScript를 켜 주세요.

The converter appears here in a moment. If it doesn't, enable JavaScript in your browser.

사용 방법

How to use

  1. 변환할 PDF 파일을 이 페이지로 끌어다 놓거나 파일 선택 버튼으로 불러옵니다.
  2. PDF가 브라우저 안에서 바로 분석되고 페이지 순서대로 텍스트가 추출됩니다.
  3. 추출된 텍스트를 미리 확인한 뒤 .txt 파일로 내려받거나 클립보드에 복사합니다.
  4. 긴 PDF라면 추출 후 줄바꿈이나 머리글·바닥글 정도만 가볍게 다듬어 사용하세요.
  1. Drag your PDF onto this page, or click to browse and select the file.
  2. The PDF is analyzed right in your browser and text is pulled out page by page, in order.
  3. Preview the extracted text, then download it as a .txt file or copy it to your clipboard.
  4. For long PDFs, do a quick cleanup of line breaks or repeating headers and footers after extraction.

왜 Converdoc 인가

Why Converdoc

참고 사항

Good to know

자주 묻는 질문

FAQ

스캔한 PDF에서도 텍스트가 추출되나요?Will this extract text from a scanned PDF?

아니요. 스캔본은 글자가 이미지로 저장되어 있어 텍스트 레이어가 없습니다. 이 도구는 디지털로 만들어진 텍스트 기반 PDF용이며, 스캔본은 OCR 도구가 필요합니다. PDF에서 글자를 드래그해 선택할 수 있으면 추출이 잘 됩니다.

No. Scanned PDFs store text as images and have no text layer to read. This tool is for digitally created, text-based PDFs; scanned documents need an OCR tool. A quick test: if you can drag to select the text inside the PDF, extraction will work.

제 PDF 파일이 어딘가에 업로드되나요?Is my PDF uploaded anywhere?

아니요. 변환은 전적으로 브라우저 안에서 처리되며 파일이 서버로 전송되거나 저장되지 않습니다. 계약서나 내부 보고서처럼 민감한 문서도 안전하게 추출할 수 있습니다.

No. The conversion runs entirely in your browser, and your file is never sent to or stored on a server. That makes it safe for sensitive documents like contracts or internal reports.

서식이나 표, 글꼴은 그대로 유지되나요?Are formatting, tables, and fonts preserved?

결과물은 서식 없는 일반 텍스트(.txt)입니다. 굵게·글꼴·이미지 같은 서식은 빠지고 본문 글자만 남으며, 표는 내용은 나오되 칸 정렬이 흐트러질 수 있습니다.

The output is plain, unformatted text (.txt). Styling like bold, fonts, and images is dropped, leaving just the words. Tables come through as text but their column alignment may not be preserved.

파일 크기나 페이지 수에 제한이 있나요?Is there a file size or page limit?

정해진 제한은 없지만 처리가 사용자 기기에서 이뤄지므로, 수백 페이지짜리 큰 PDF는 기기 성능에 따라 시간이 더 걸릴 수 있습니다.

There's no fixed limit, but since processing happens on your own device, a very large PDF of several hundred pages may take longer depending on your hardware.

다른 변환 도구

More conversions