en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países

Conjunto de datos OCR multilingüe
datos de reconocimiento de texto en escenas
conjunto de datos OCR de documentos
datos OCR de pantallas electrónicas
conjunto de datos OCR 21 idiomas
datos de entrenamiento OCR para IA
conjunto de datos de reconocimiento de texto

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países. Los datos incluyen 21 idiomas, con una distribución de 20,000 a 25,000 imágenes por idioma. Los tipos de datos incluyen escenas naturales, escenas de fotos de documentos y escenas electrónicas. La diversidad de datos incluye múltiples tipos de datos, múltiples ángulos de captura y múltiples idiomas. En cuanto a la anotación, se utiliza anotación a nivel de fila (columna) con cuadriláteros o polígonos y transcripción de contenido a nivel de fila (columna). Los datos pueden utilizarse para tareas de reconocimiento OCR multilingüe.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Escala de datos
500,000 imágenes, distribución de 20,000 a 25,000 imágenes por idioma
Distribución de idiomas
Alemán, Francés, Portugués, Italiano, Español, Indonesio, Ruso, Japonés, Coreano, Vietnamita, Polaco, Checo, Turco, Filipino, Neerlandés, Hindi, Malayo, Kazajo, Eslovaco, Rumano, Uzbeko
Entorno de recolección
Escenas de fotos de documentos: libros, periódicos, varios tipos de tarjetas, tickets, etc.; Escenas naturales: carteles, señales de advertencia, señales de tráfico, envases de alimentos, vallas publicitarias, paradas de autobús, letreros, etc.; Escenas electrónicas: capturas de pantalla de móviles, capturas de pantalla de computadoras, documentos electrónicos
Diversidad de recolección
Múltiples tipos de datos, múltiples ángulos de captura, múltiples idiomas
Dispositivos de recolección
Teléfono móvil, computadora
Formatos de datos
El formato de imagen es .jpg y otros formatos comunes, el formato del documento de anotación es .json
Contenido de la anotación
Anotación a nivel de fila (columna) con cuadriláteros o polígonos, transcripción de contenido a nivel de fila (columna)
Precisión
La precisión del cuadro de detección a nivel de fila no es inferior al 97%, se considera una anotación correcta si la división de filas es correcta y la desviación en los cuatro lados no supera los 5 píxeles; La precisión de la transcripción a nivel de fila y de carácter no es inferior al 97%.
Ejemplo Ejemplo
Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

60c41a4f-f6b9-4cb5-ab84-c0e80350e9e8

7c02b2d0-82ab-4824-a01d-49b20749a534