es

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

Datasets de OCR

Mejore instantáneamente el rendimiento del modelo de IA con Datasets listos para usar de alta calidad.

Tipo de dato

Todo
28
Documento
3
Escenario general
13
Escritura a mano
15
Imagen de internet
1
Factura
3
Otros
4
Examen
1
Tabla
1

Idioma

Todo
28
Chino
6
Inglés
4
Hindi
4
Japonés
7
Coreano
7
Otros
20
Vietnamita
4

4.995 imágenes datos OCR vietnamita: anotación + transcripción

4.995 imágenes de datos de OCR en vietnamita anotados y transcritos incluyen 258 imágenes naturales, 2.553 de internet, 2.184 de texto. Anotación: Contenido por línea: caja delimitadora cuadrilátera por línea, transcripción por línea; Contenido vertical: caja delimitadora cuadrilátera vertical, transcripción vertical. Este conjunto de datos de OCR en vietnamita anotados y transcritos puede usarse para reconocimiento de vietnamita en múltiples escenarios, traducción fotográfica de vietnamita, etc.
Vietnamita OCR imágenes documentos imágenes internet escenas naturales múltiples ángulos diferentes condiciones luz anotación cuadrilátero delimitador transcripción nivel línea textos transcripción nivel columna textos

3.506 imágenes datos OCR hindi: anotación + transcripción

3.506 imágenes de datos de OCR en hindi anotados y transcritos incluyen 2.056 imágenes naturales, 1.103 de internet, 347 de texto. Anotación: Contenido por línea: caja delimitadora cuadrilátera por línea, transcripción por línea; Contenido vertical: caja delimitadora cuadrilátera vertical, transcripción vertical. Este conjunto de datos de OCR en hindi anotados y transcritos puede usarse para reconocimiento de hindi en múltiples escenarios, traducción fotográfica de hindi, etc.
Hindi OCR imágenes documentos imágenes internet escenas naturales múltiples ángulos diferentes condiciones luz anotación cuadrilátero delimitador transcripción nivel línea textos transcripción nivel columna textos

57.645 imágenes datos OCR escenas texto vertical

57.645 datos OCR de escenas de texto verticales. Las escenas de la colección incluyen escenas de calles, placas, vallas publicitarias, carteles, decoraciones, caracteres artísticos, portadas de revistas, etc. La distribución lingüística es china e inglesa (unas pocas). En cuanto a las anotaciones, se pueden realizar anotaciones en cajas rectangulares a nivel de columna (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido a nivel de columna; anotaciones en cajas rectangulares no verticales (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido no verticales. Este conjunto de datos puede utilizarse para diversas tareas de OCR de escenas de texto verticales.
Datos OCR escenas texto vertical Datos imagen OCR Datos OCR Conjunto datos OCR Anotación OCR Adquisición OCR Procesamiento datos OCR Datos reescritura OCR

14.980 imágenes datos OCR PPT 8 idiomas

14.980 imágenes de datos OCR de PPT en 8 idiomas que cubren 8 idiomas, múltiples escenas, diferentes ángulos de captura, diferentes distancias de captura y diferentes condiciones de iluminación. En cuanto a anotaciones, se realizó anotación de cuadriláteros para texto a nivel de línea y transcripción de texto a nivel de línea. Este conjunto de datos OCR de PPT multilingüe puede utilizarse para tareas OCR en múltiples idiomas.
PPT OCR sala reuniones sala conferencias diferentes ángulos fotográficos diferentes distancias fotográficas diferentes condiciones luz anotación cuadrilátero nivel línea y transcripción para textos

100 personas de datos de escritura manual japonés-coreana

Datos de escritura manual japonesa/coreana de 100 personas, los participantes totales son 100 personas: 50 japoneses, 49 coreanos y 1 afgano. Para cada persona, el corpus escrito es diferente. La diversidad de datos incluye múltiples dispositivos móviles y diferentes corpus. Este conjunto de datos de escritura manual japonesa/coreana puede utilizarse para reconocimiento OCR de escritura manual japonesa y coreana.
Japonés Coreano OCR de escritura manual Trazo de escritura manual

5.147 imágenes de datos OCR de escritura manual japonés

5.147 datos OCR de escritura manual en japonés. Los soportes de texto son papel A4, papel rayado horizontal, papel cuadriculado, etc. El equipo de recopilación fue teléfono móvil, el ángulo de recopilación fue ángulo de visión horizontal. El contenido de estos datos cubre campos como ensayos en japonés, poesía, prosa, noticias, historias. En términos de anotación, se anotan cuadriláteros de texto a nivel de línea, transcripción de texto a nivel de línea. Este conjunto de datos se puede utilizar para tareas OCR de escritura manual japonesa.
Japonés Escritura manual OCR anotación nivel línea transcripción texto nivel línea

101 personas 4.538 imágenes datos OCR escritura manual japonés

Datos OCR de escritura manual japonesa de 4.538 imágenes de 101 personas, el soporte de texto es papel A4. El contenido de estos datos cubre áreas como asuntos sociales, entretenimiento, turismo, eventos deportivos, cine, composición musical, etc. En cuanto a la anotación, se realizó anotación de cuadros delimitadores a nivel de carácter, transcripción de contenido a nivel de carácter, anotación de cuadros delimitadores a nivel de línea y transcripción de contenido a nivel de línea. Este conjunto de datos puede usarse para tareas OCR de escritura manual japonesa.
Escritura manual japonesa OCR anotación cuadro delimitador rectangular nivel carácter transcripción texto caligrafía garabatos manuscrito datos OCR japonés

105.941 imágenes datos OCR 12 idiomas escenas naturales

Los 105.941 datos OCR de escenas naturales abarcan 12 idiomas, incluidos 6 idiomas asiáticos y 6 idiomas europeos, y la colección cubre una variedad de escenas naturales y una variedad de ángulos de toma. En cuanto a la anotación, se etiquetan los cuadros cuadriláteros de texto a nivel de línea y se transcribe el texto a nivel de línea. Este conjunto de datos puede utilizarse para tareas de OCR multilingüe.
Japonés Coreano Indonesio Malayo Vietnamita Tailandés Francés Alemán Italiano Portugués Ruso Español OCR escenas naturales múltiples ángulos fotográficos anotación cuadrilátero nivel línea y transcripción para textos

500.000 imágenes de datos OCR de escenas naturales y documentos en múltiples países

500.000 imágenes de datos OCR de escenas naturales y documentos multinacionales, que incluyen 20 idiomas como chino tradicional, japonés, coreano, indonesio, malayo, tailandés, vietnamita, polaco, etc. La diversidad de captura incluye múltiples escenas naturales, múltiples ángulos de toma. Este conjunto de datos puede usarse para tareas OCR de idiomas multinacionales.
Escenas naturales Documentos OCR

loading

Personalice sus datos ahora

Por qué Datasets listos para usar

  • Derechos de autor

    Derechos de autor

    Derechos de autor claros y Listo para revisar
  • Seguridad

    Seguridad

    Autorizado adecuadamente Uso seguro
  • Profesional

    Profesional

    Diseñado y producido por expertos en datos de IA
  • Diversidad

    Diversidad

    Recogido de una variedad de escenas reales
  • Efectivo en costos

    Efectivo en costos

    Más rentable que los datos personalizados
  • Eficiencia

    Eficiencia

    Listo para llevar entrega en segundos
7cd69c03-5449-43c9-866d-852db43772c2