关于此工具
使用编译为 WebAssembly 并完全在浏览器中运行的 Tesseract OCR 引擎,从任意图片(照片、截图或扫描页面)中读取文字。图片不会被上传;OCR 模型仅下载一次(之后会被缓存),所有识别都在你的设备上完成。
常见问题
我的图片会被上传到 OCR 服务器吗?
不会。OCR 通常在云端运行,但在这里,完整的 Tesseract 引擎以 WebAssembly 的形式在本地运行——图片和识别出的文字都不会离开你的浏览器。
为什么首次运行需要等几秒钟?
首次运行时需要加载 WASM 版 OCR 引擎和英文语言模型(约 6 MB)。两者之后都会被缓存,因此后续运行会很快启动。
怎样才能获得最佳识别效果?
请使用清晰、对比度高且较为端正的图片。当前识别使用英文模型,对印刷体文字效果最佳。