en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

104.320 imágenes datos OCR escenas naturales coreano-hindi

Coreano
Hindi
Datos OCR
Escena natural
Datos transliteración OCR

104.320 datos OCR de escenas naturales en coreano e hindi. Escenarios de recopilación incluyen empaques de productos, carteles, boletos de transporte, letreros informativos, menús, señales de edificios, etc. Diversidad: múltiples escenarios, ángulos de captura, condiciones de iluminación. Distribución lingüística: coreano, hindi e inglés (pequeña cantidad). En anotaciones: Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de línea, transcripción de contenido a nivel de línea, atributos de texto (tipo de idioma); Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de columna, transcripción de contenido a nivel de columna, atributos de texto (tipo de idioma). Este conjunto de datos OCR de escenas naturales en coreano e hindi puede usarse para tareas OCR en escenas naturales coreanas e hindúes.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Escala de datos
Coreano 76.861 imágenes, 555.913 cuadros; hindi 27.459 imágenes, 200.453 cuadros
Entorno de captura
Incluye empaques comerciales, carteles, tickets, frases informativas, menús, señales edificatorias, etc.
Diversidad de captura
Múltiples escenarios naturales, múltiples ángulos de captura, diferentes condiciones de iluminación
Equipos de captura
Teléfonos móviles
Ángulo
Vista inferior, vista superior, visión normal
Distribución lingüística
Coreano, hindi, inglés (poca cantidad)
Formato de datos
El formato de imagen es .jpg y el formato de archivo de anotación es .json.
Distribución de las formas de los recuadros de marcado
Coreano 315.822 casillas cuadriláteras, 240.091 casillas poligonales; hindi 780 casillas cuadriláteras, 199.671 casillas poligonales, 2 casillas rectangulares
Contenido de etiquetado
Anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de línea/fila, transcripción de contenido, atributos de texto (idioma); anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de columna, transcripción de contenido, atributos de texto (idioma)
Precisión
Se detecta correctamente una desviación del vértice del recuadro de marcado no superior a cinco píxeles, la precisión del recuadro de detección no es inferior al 95%; la precisión de la transcripción del texto no es inferior al 95%
Ejemplo Ejemplo
  • 104.320 imágenes datos OCR escenas naturales coreano-hindi
  • 104.320 imágenes datos OCR escenas naturales coreano-hindi
  • 104.320 imágenes datos OCR escenas naturales coreano-hindi
Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

f1921457-878a-40f9-87f8-53b23834a5d1

ff2a41ec-863b-41ac-8d58-f0f47b6da6b4