OCR con Vue y Tesseract

OCR con Vue y Tesseract

Lo idea original era crear un generador de páginas tipo drag and drop y que esta nos generase el equivalente en código HTML, CSS y Javascript.

Despues de buscar información, esa idea se ha convertido en una pequeña aplicación que transforma las imagenes a texto, vamos un OCR (Optical character recognition).

Para realizar esta aplicación estuve investigando de que forma se puede convertir cualquier imagen a texto, y de esta forma detectar los elementos en la imagen para generar el código equivalente.

conversion imagen a texto

En la busqueda de recursos para realizar dicha tarea me tope con una librería muy interensate llamada tesseract.js y que además hace justamente lo que necestio.

Según su página tesseract.js es un port de Tesseract OCR engine, tiene soporte para mas de 100 idiomas, orientación automática del texto, detección de guiones y puede ejecutarse tanto en un navegador como en un servidor con NodeJS.

Desde su repositorio en github podeis acceder a toda la documentación y múltiples ejemplos.

La aplicación que he desarrollado la puedes usar desde aquí, tanto desde un ordenador como desde el movil, y pienso que puede ser bastante util si quieres extraer el texto de cualquier imagen.

Otra cosa importante que quiero recalcar: la aplicación se ejecuta en local, no se envia ningún dato a ningún servicio y no se sube ninguna imagen ni almacena nada.

Paso de imagen a textoReconocimient de imagen a texto Se obtiene el texto de la imagen

Para finalizar si quieres echar un ojo al código fuente, puedes hacerlo desde el repositorio en Github.