Converdoc

이미지·스캔 PDF에서 텍스트 추출하기 (OCR)

Extract Text from Images & Scanned PDFs (OCR)

스캔한 서류, 캡처 화면, 사진 속 글자를 직접 다시 타이핑할 필요 없이 OCR로 읽어내 복사·편집 가능한 텍스트로 바꿔줍니다. 한국어와 영어를 모두 인식하며, 모든 처리는 브라우저 안에서만 이루어져 파일이 외부로 전송되지 않습니다. 처음 실행할 때는 인식용 언어 데이터를 한 번 내려받기 때문에 약간 시간이 걸릴 수 있습니다.

Turn scanned documents, screenshots, and photos into copyable, editable text without retyping a single line. The OCR engine recognizes both Korean and English and runs entirely in your browser, so your files are never sent anywhere. The first run downloads the recognition language data once, which can take a little time.

이미지·스캔 PDF에서 텍스트 추출하기 (OCR) — 브라우저에서 바로 처리하는 무료 도구입니다. 아래에 파일을 올리면 변환이 시작되며, 파일은 서버로 업로드되지 않습니다.

Extract Text from Images & Scanned PDFs (OCR) — a free tool that runs right in your browser. Add your files below and the conversion starts; nothing is uploaded.

변환 도구가 곧 여기에 나타납니다. 보이지 않으면 브라우저에서 JavaScript를 켜 주세요.

The converter appears here in a moment. If it doesn't, enable JavaScript in your browser.

사용 방법

How to use

  1. 글자가 담긴 이미지(JPG·PNG 등)나 스캔된 PDF 파일을 끌어다 놓거나 선택합니다.
  2. 추출할 언어로 한국어·영어를 확인하고 변환 시작을 누릅니다.
  3. 첫 실행이라면 언어 데이터를 내려받는 동안 잠시 기다립니다(이후에는 빨라집니다).
  4. 추출된 텍스트를 복사하거나 .txt 파일로 내려받습니다.
  1. Drop or select an image (JPG, PNG, etc.) or a scanned PDF that contains text.
  2. Confirm Korean/English as the recognition language and start the conversion.
  3. On the first run, wait briefly while the language data downloads (later runs are faster).
  4. Copy the extracted text or download it as a .txt file.

왜 Converdoc 인가

Why Converdoc

참고 사항

Good to know

OCR이 쓸모 있는 곳

Where OCR helps

종이 영수증, 명함, 책의 한 페이지, 화면 캡처처럼 "글자가 그림으로 박힌" 자료에서 텍스트를 꺼내야 할 때 OCR(광학 문자 인식)을 씁니다. 다시 타이핑하지 않고 복사·검색·편집할 수 있는 글자로 바꿔 줍니다.

한국어·영어를 비롯해 일본어·중국어 등 12개 언어를 인식하며, 문서에 영어가 섞여 있어도 함께 잡습니다. 결과를 텍스트로 받거나, 원본처럼 보이면서 글자를 검색·복사할 수 있는 "검색가능 PDF"로 저장할 수도 있습니다.

인식 엔진과 언어 데이터는 처음 한 번만 내려받고, 이미지 자체는 업로드되지 않습니다. 글자가 또렷하고 반듯한 이미지일수록 정확도가 높아집니다.

OCR (optical character recognition) is for pulling text out of material where the letters are baked into an image — paper receipts, business cards, a book page, a screenshot. It turns them into text you can copy, search and edit instead of retyping.

It recognizes 12 languages including Korean, English, Japanese and Chinese, and catches English mixed into a document. Get the result as plain text, or save a "searchable PDF" that looks like the original but lets you search and copy the text.

The engine and language data download only once, and the image itself is never uploaded. The clearer and straighter the text in the image, the higher the accuracy.

자주 묻는 질문

FAQ

검색가능 PDF가 뭔가요?What is a searchable PDF?

스캔본처럼 보이는 PDF 위에 인식된 글자를 보이지 않는 텍스트 층으로 얹은 PDF입니다. 보기에는 원본과 같지만 글자를 검색하고 복사할 수 있습니다.

It is a PDF that looks like the scanned original but has the recognized text added as an invisible layer, so you can search and copy the text.

추출한 글자가 정확하지 않은 이유는 무엇인가요?Why is the extracted text not perfectly accurate?

OCR은 이미지를 분석해 글자를 추정하기 때문에 원본 해상도가 낮거나 글자가 흐릿하고 기울어져 있으면 오류가 생깁니다. 가능하면 또렷하고 반듯하게 스캔·촬영한 이미지를 사용하고, 결과는 한 번 검토해 주세요.

OCR estimates characters by analyzing the image, so low resolution, blur, or skew can cause errors. Use a sharp, straight scan or photo when possible, and proofread the result.

내 문서가 서버로 전송되나요?Is my document sent to a server?

아니요. OCR 처리가 모두 브라우저 안에서 이루어지므로 이미지나 PDF 파일이 서버로 업로드되지 않습니다. 민감한 계약서나 신분 서류도 비교적 안전하게 처리할 수 있습니다.

No. All OCR processing happens inside your browser, so your images and PDFs are never uploaded. This makes it reasonably safe even for sensitive contracts or ID documents.

첫 변환이 왜 이렇게 오래 걸리나요?Why does the first conversion take so long?

처음 실행할 때 글자 인식에 필요한 언어 데이터를 한 번 내려받기 때문입니다. 이 과정은 한 번만 거치면 캐시되어, 같은 브라우저에서는 다음부터 훨씬 빠르게 동작합니다.

The first run downloads the language data needed for character recognition. This happens only once and is then cached, so subsequent conversions in the same browser are much faster.

스캔된 PDF도 변환할 수 있나요?Can I convert scanned PDFs too?

네. 글자가 이미지 형태로만 들어 있는 스캔 PDF는 OCR로 텍스트를 추출합니다. 다만 텍스트 레이어가 이미 있는 일반 PDF라면 OCR 없이 텍스트를 바로 뽑는 변환이 더 빠르고 정확합니다.

Yes. Scanned PDFs that contain only image-based text are handled with OCR. If your PDF already has a real text layer, a direct PDF-to-text extraction without OCR is faster and more accurate.

인식 정확도를 높이려면 어떻게 하나요?How can I improve accuracy?

글자가 또렷하고 수평이 맞으며 빛 반사가 적은 이미지일수록 정확합니다. 너무 작거나 기울어진 사진은 정확도가 떨어질 수 있습니다.

Clear, level images with little glare work best. Photos that are too small or skewed reduce accuracy.

손글씨도 인식되나요?Does it read handwriting?

인쇄된 글자에 최적화되어 있어 손글씨는 정확도가 많이 낮습니다. 활자로 된 문서·영수증·책에 가장 잘 맞습니다.

It is tuned for printed text, so handwriting accuracy is much lower. It works best on typeset documents, receipts and books.

다른 변환 도구

More conversions