en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

105.941 imágenes datos OCR 12 idiomas escenas naturales

Japonés
Coreano
Indonesio
Malayo
Vietnamita
Tailandés
Francés
Alemán
Italiano
Portugués
Ruso
Español
OCR
escenas naturales
múltiples ángulos fotográficos
anotación cuadrilátero nivel línea y transcripción para textos

Los 105.941 datos OCR de escenas naturales abarcan 12 idiomas, incluidos 6 idiomas asiáticos y 6 idiomas europeos, y la colección cubre una variedad de escenas naturales y una variedad de ángulos de toma. En cuanto a la anotación, se etiquetan los cuadros cuadriláteros de texto a nivel de línea y se transcribe el texto a nivel de línea. Este conjunto de datos puede utilizarse para tareas de OCR multilingüe.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Escala de datos
105.941 imágenes, incluyendo familia asiática: 9.997 imágenes en japonés, 10.231 imágenes en coreano, 7.591 imágenes en indonesio, 5.650 imágenes en malayo, 8.822 imágenes en vietnamita, 9.645 imágenes en tailandés; familia europea: 10.015 imágenes en francés, 7.213 imágenes en alemán, 8.824 imágenes en italiano, 7.754 imágenes en portugués, 10.376 imágenes en ruso, 9.823 imágenes en español
Entorno de captura
Incluye rótulos comerciales, paradas, carteles, tickets, señales, cómics, tapas de alcantarilla, frases informativas, advertencias, empaques, menús, señales edificatorias, etc.
Diversidad de captura
Incluye 12 idiomas, múltiples escenas de naturaleza, múltiples ángulos de cámara (vista inferior, vista superior, visión normal)
Equipos de captura
Teléfonos móviles, cámaras
Parámetros de imagen
El formato de imagen es .jpg, el formato de anotación es .json
Contenido de etiquetado
Marcado de cuadriláteros a nivel de línea, transcripción de contenidos a nivel de línea
Precisión
Se detecta correctamente una desviación del vértice de la caja cuadrangular de no más de cinco píxeles; la precisión de la detección de la caja no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%.
Ejemplo Ejemplo
  • 105.941 imágenes datos OCR 12 idiomas escenas naturales
  • 105.941 imágenes datos OCR 12 idiomas escenas naturales
  • 105.941 imágenes datos OCR 12 idiomas escenas naturales
Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

51c6c012-185c-4c2d-8a04-834d662edbc6

795485a2-bf71-409b-a192-98436c2f1763