Proyectos

Tachiwin OCR 1.5

Modelo para la Digitalización y conversión de imagen a texto en lenguas originarias

Tachiwin OCR 1.5 es la evolución de nuestro modelo premiado. Hemos mejorado el reconocimiento de caracteres especiales y diacríticos comunes en las lenguas de México.

¿Para qué sirve?

Digitalizar documentos impresos o manuscritos en lenguas indígenas.

¿Cómo se usa?

Escanea el documento y procésalo con el modelo para obtener texto editable.

Justificación

Muchos documentos históricos están en papel y se están perdiendo; la digitalización es clave para su preservación.

Datos Técnicos

Tipo de Modelo: LLM Modelo Base: PaddleOCR-VL-1.5 Entrenamiento: Full-Finetuning

Software Libre & Código Abierto