500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países

Conjunto de datos OCR multilingüe

datos de reconocimiento de texto en escenas

conjunto de datos OCR de documentos

datos OCR de pantallas electrónicas

conjunto de datos OCR 21 idiomas

datos de entrenamiento OCR para IA

conjunto de datos de reconocimiento de texto

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países. Los datos incluyen 21 idiomas, con una distribución de 20,000 a 25,000 imágenes por idioma. Los tipos de datos incluyen escenas naturales, escenas de fotos de documentos y escenas electrónicas. La diversidad de datos incluye múltiples tipos de datos, múltiples ángulos de captura y múltiples idiomas. En cuanto a la anotación, se utiliza anotación a nivel de fila (columna) con cuadriláteros o polígonos y transcripción de contenido a nivel de fila (columna). Los datos pueden utilizarse para tareas de reconocimiento OCR multilingüe.

Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.

Especificaciones

Escala de datos

500,000 imágenes, distribución de 20,000 a 25,000 imágenes por idioma

Distribución de idiomas

Alemán, Francés, Portugués, Italiano, Español, Indonesio, Ruso, Japonés, Coreano, Vietnamita, Polaco, Checo, Turco, Filipino, Neerlandés, Hindi, Malayo, Kazajo, Eslovaco, Rumano, Uzbeko

Entorno de recolección

Escenas de fotos de documentos: libros, periódicos, varios tipos de tarjetas, tickets, etc.; Escenas naturales: carteles, señales de advertencia, señales de tráfico, envases de alimentos, vallas publicitarias, paradas de autobús, letreros, etc.; Escenas electrónicas: capturas de pantalla de móviles, capturas de pantalla de computadoras, documentos electrónicos

Diversidad de recolección

Múltiples tipos de datos, múltiples ángulos de captura, múltiples idiomas

Dispositivos de recolección

Teléfono móvil, computadora

Formatos de datos

El formato de imagen es .jpg y otros formatos comunes, el formato del documento de anotación es .json

Contenido de la anotación

Anotación a nivel de fila (columna) con cuadriláteros o polígonos, transcripción de contenido a nivel de fila (columna)

Precisión

La precisión del cuadro de detección a nivel de fila no es inferior al 97%, se considera una anotación correcta si la división de filas es correcta y la desviación en los cuatro lados no supera los 5 píxeles; La precisión de la transcripción a nivel de fila y de carácter no es inferior al 97%.

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países

Conjunto de datos OCR multilingüe datos de reconocimiento de texto en escenas conjunto de datos OCR de documentos datos OCR de pantallas electrónicas conjunto de datos OCR 21 idiomas datos de entrenamiento OCR para IA conjunto de datos de reconocimiento de texto

Nivel de madurez del proyecto

Conjunto de datos OCR multilingüe

datos de reconocimiento de texto en escenas

conjunto de datos OCR de documentos

datos OCR de pantallas electrónicas

conjunto de datos OCR 21 idiomas

datos de entrenamiento OCR para IA

conjunto de datos de reconocimiento de texto