57.645 imágenes datos OCR escenas texto vertical

Datos OCR escenas texto vertical

Datos imagen OCR

Datos OCR

Conjunto datos OCR

Anotación OCR

Adquisición OCR

Procesamiento datos OCR

Datos reescritura OCR

57.645 datos OCR de escenas de texto verticales. Las escenas de la colección incluyen escenas de calles, placas, vallas publicitarias, carteles, decoraciones, caracteres artísticos, portadas de revistas, etc. La distribución lingüística es china e inglesa (unas pocas). En cuanto a las anotaciones, se pueden realizar anotaciones en cajas rectangulares a nivel de columna (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido a nivel de columna; anotaciones en cajas rectangulares no verticales (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido no verticales. Este conjunto de datos puede utilizarse para diversas tareas de OCR de escenas de texto verticales.

Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.

Especificaciones

Escala de datos

57.645 imágenes, 528.553 cuadros

Entorno de captura

Incluye vistas callejeras, rótulos, vallas publicitarias, carteles, decoraciones, tipografía artística, portadas de revistas, etc.

Diversidad de captura

Múltiples escenarios, múltiples tipografías

Distribución lingüística

Chino, inglés (poca cantidad)

Distribución de la dirección del marco de anotación

324.399 cuadros verticales, 204.154 cuadros no verticales

Distribución de las formas de los recuadros de marcado

34.936 casillas rectangulares, 220.716 casillas poligonales, 272.901 casillas paralelogramos

Formato de datos

El formato de los datos de imagen es .jpg, y el formato del archivo de anotación es .json.

Contenido de etiquetado

Anotación de cuadro rectangular (poligonal, paralelogramo) a nivel de columna, transcripción de contenido a nivel de columna; anotación de cuadro no vertical (poligonal, paralelogramo), transcripción de contenido no vertical

Precisión

Se detecta correctamente una desviación del vértice de la caja de marcadores no superior a tres píxeles, y la precisión de la caja de detección no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%

57.645 imágenes datos OCR escenas texto vertical

Datos OCR escenas texto vertical Datos imagen OCR Datos OCR Conjunto datos OCR Anotación OCR Adquisición OCR Procesamiento datos OCR Datos reescritura OCR

Nivel de madurez del proyecto

Datos OCR escenas texto vertical

Datos imagen OCR

Datos OCR

Conjunto datos OCR

Anotación OCR

Adquisición OCR

Procesamiento datos OCR

Datos reescritura OCR