이미지에서 텍스트 추출 (OCR)

처음 사용할 때 엔진을 불러오므로 오프라인 다운로드는 제공되지 않습니다. 그래도 브라우저에서 비공개로 실행되며 아무것도 업로드되지 않습니다.

이 도구에 대하여

사진, 스크린샷, 스캔한 문서 등 어떤 이미지에서든 텍스트를 읽어냅니다. WebAssembly로 컴파일된 Tesseract OCR 엔진을 사용해 모든 작업이 브라우저 안에서 실행됩니다. 이미지는 업로드되지 않으며, OCR 모델은 한 번만 내려받은 뒤 캐시되고 모든 인식은 사용자의 기기에서 이루어집니다.

자주 묻는 질문

제 이미지가 OCR 서버로 전송되나요?

아니요. OCR은 보통 클라우드에서 실행되지만, 여기서는 전체 Tesseract 엔진이 WebAssembly로 사용자의 기기에서 실행됩니다. 이미지와 인식된 텍스트는 브라우저를 벗어나지 않습니다.

처음 실행할 때 몇 초가 걸리는 이유는 무엇인가요?

처음에는 WASM OCR 엔진과 영어 언어 모델(약 6 MB)을 불러옵니다. 둘 다 이후에는 캐시되므로 다음 실행부터는 빠르게 시작됩니다.

어떻게 하면 가장 좋은 결과를 얻을 수 있나요?

선명하고 대비가 높으며 비교적 똑바로 찍힌 이미지를 사용하세요. 현재는 영어 모델로 인식하며 인쇄된 텍스트에서 가장 잘 작동합니다.

이 도구에 대하여

자주 묻는 질문

더 많은 도구