es

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

Datasets de OCR

Mejore instantáneamente el rendimiento del modelo de IA con Datasets listos para usar de alta calidad.

Tipo de dato

Todo
29
Documento
3
Escenario general
13
Escritura a mano
15
Imagen de internet
3
Factura
3
Otros
5
Examen
1
Tabla
1

Idioma

Todo
29
Chino
7
Inglés
4
Hindi
4
Japonés
7
Coreano
7
Otros
20
Vietnamita
4

222.289 imágenes de datos OCR de escenas naturales chinas

222.289 imágenes de datos OCR de escenas naturales en chino, las escenas de recopilación cubren interiores y exteriores. La diversidad de datos incluye múltiples escenas y múltiples ángulos de captura. En cuanto a anotaciones, se realiza anotación a nivel de línea, anotación a nivel de palabra, anotación a nivel de carácter y transcripción de contenido para el texto en las imágenes. Este conjunto de datos OCR de escenas naturales en chino puede utilizarse para tareas OCR en escenas naturales.
OCR Escenas naturales Anotación a nivel de línea Anotación a nivel de palabra Anotación a nivel de carácter Transcripción para textos

9.497 imágenes datos OCR 10 tipos formularios

9.497 imágenes de datos OCR para 10 tipos de tablas, anotadas mediante cuadros delimitadores rectangulares. Este conjunto es utilizable para detección y reconocimiento de tablas.
OCR formularios

17.561 imágenes datos captura exámenes matemáticas primaria

17.561 imágenes de datos de recolección de exámenes matemáticos de primaria con fondo liso. Cubre múltiples tipos de preguntas, formatos de examen (cuadernillos, exámenes, pruebas competitivas, etc.), grados. Este conjunto de datos de recolección de exámenes matemáticos de primaria puede usarse para corrección automática, tutorías, etc.
Exámenes matemáticas primaria OCR múltiples tipos preguntas (Cálculo vertical Cálculo horizontal Cálculo recursivo Fracciones Resolución ecuaciones etc.) múltiples tipos exámenes (cuadernos ejercicios exámenes preguntas competición) múltiples cursos

4.995 imágenes datos OCR vietnamita: anotación + transcripción

4.995 imágenes de datos de OCR en vietnamita anotados y transcritos incluyen 258 imágenes naturales, 2.553 de internet, 2.184 de texto. Anotación: Contenido por línea: caja delimitadora cuadrilátera por línea, transcripción por línea; Contenido vertical: caja delimitadora cuadrilátera vertical, transcripción vertical. Este conjunto de datos de OCR en vietnamita anotados y transcritos puede usarse para reconocimiento de vietnamita en múltiples escenarios, traducción fotográfica de vietnamita, etc.
Vietnamita OCR imágenes documentos imágenes internet escenas naturales múltiples ángulos diferentes condiciones luz anotación cuadrilátero delimitador transcripción nivel línea textos transcripción nivel columna textos

104.320 imágenes datos OCR escenas naturales coreano-hindi

104.320 datos OCR de escenas naturales en coreano e hindi. Escenarios de recopilación incluyen empaques de productos, carteles, boletos de transporte, letreros informativos, menús, señales de edificios, etc. Diversidad: múltiples escenarios, ángulos de captura, condiciones de iluminación. Distribución lingüística: coreano, hindi e inglés (pequeña cantidad). En anotaciones: Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de línea, transcripción de contenido a nivel de línea, atributos de texto (tipo de idioma); Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de columna, transcripción de contenido a nivel de columna, atributos de texto (tipo de idioma). Este conjunto de datos OCR de escenas naturales en coreano e hindi puede usarse para tareas OCR en escenas naturales coreanas e hindúes.
Coreano Hindi Datos OCR Escena natural Datos transliteración OCR

105.941 imágenes datos OCR 12 idiomas escenas naturales

Los 105.941 datos OCR de escenas naturales abarcan 12 idiomas, incluidos 6 idiomas asiáticos y 6 idiomas europeos, y la colección cubre una variedad de escenas naturales y una variedad de ángulos de toma. En cuanto a la anotación, se etiquetan los cuadros cuadriláteros de texto a nivel de línea y se transcribe el texto a nivel de línea. Este conjunto de datos puede utilizarse para tareas de OCR multilingüe.
Japonés Coreano Indonesio Malayo Vietnamita Tailandés Francés Alemán Italiano Portugués Ruso Español OCR escenas naturales múltiples ángulos fotográficos anotación cuadrilátero nivel línea y transcripción para textos

100 personas de datos de escritura manual japonés-coreana

Datos de escritura manual japonesa/coreana de 100 personas, los participantes totales son 100 personas: 50 japoneses, 49 coreanos y 1 afgano. Para cada persona, el corpus escrito es diferente. La diversidad de datos incluye múltiples dispositivos móviles y diferentes corpus. Este conjunto de datos de escritura manual japonesa/coreana puede utilizarse para reconocimiento OCR de escritura manual japonesa y coreana.
Japonés Coreano OCR de escritura manual Trazo de escritura manual

101 personas 4.538 imágenes datos OCR escritura manual japonés

Datos OCR de escritura manual japonesa de 4.538 imágenes de 101 personas, el soporte de texto es papel A4. El contenido de estos datos cubre áreas como asuntos sociales, entretenimiento, turismo, eventos deportivos, cine, composición musical, etc. En cuanto a la anotación, se realizó anotación de cuadros delimitadores a nivel de carácter, transcripción de contenido a nivel de carácter, anotación de cuadros delimitadores a nivel de línea y transcripción de contenido a nivel de línea. Este conjunto de datos puede usarse para tareas OCR de escritura manual japonesa.
Escritura manual japonesa OCR anotación cuadro delimitador rectangular nivel carácter transcripción texto caligrafía garabatos manuscrito datos OCR japonés

30.000 imágenes de datos OCR de escenas naturales en idiomas minoritarios del sudeste asiático

30.000 imágenes de datos OCR de escenas naturales en idiomas minoritarios del sudeste asiático, que incluyen 3 idiomas: jemer (Camboya), laosiano y birmano. La diversidad de captura incluye múltiples escenas naturales, múltiples ángulos de toma. Este conjunto de datos puede usarse para tareas OCR de idiomas del sudeste asiático.
OCR Lenguas sudeste asiático Escenas naturales

loading

Personalice sus datos ahora

Por qué Datasets listos para usar

  • Derechos de autor

    Derechos de autor

    Derechos de autor claros y Listo para revisar
  • Seguridad

    Seguridad

    Autorizado adecuadamente Uso seguro
  • Profesional

    Profesional

    Diseñado y producido por expertos en datos de IA
  • Diversidad

    Diversidad

    Recogido de una variedad de escenas reales
  • Efectivo en costos

    Efectivo en costos

    Más rentable que los datos personalizados
  • Eficiencia

    Eficiencia

    Listo para llevar entrega en segundos
552cdf37-e20a-4751-8205-54eb55cc606a