[{"@type":"PropertyValue","name":"Escala de datos","value":"57.645 imágenes, 528.553 cuadros"},{"@type":"PropertyValue","name":"Entorno de captura","value":"Incluye vistas callejeras, rótulos, vallas publicitarias, carteles, decoraciones, tipografía artística, portadas de revistas, etc."},{"@type":"PropertyValue","name":"Diversidad de captura","value":"Múltiples escenarios, múltiples tipografías"},{"@type":"PropertyValue","name":"Distribución lingüística","value":"Chino, inglés (poca cantidad)"},{"@type":"PropertyValue","name":"Distribución de la dirección del marco de anotación","value":"324.399 cuadros verticales, 204.154 cuadros no verticales"},{"@type":"PropertyValue","name":"Distribución de las formas de los recuadros de marcado","value":"34.936 casillas rectangulares, 220.716 casillas poligonales, 272.901 casillas paralelogramos"},{"@type":"PropertyValue","name":"Formato de datos","value":"El formato de los datos de imagen es .jpg, y el formato del archivo de anotación es .json."},{"@type":"PropertyValue","name":"Contenido de etiquetado","value":"Anotación de cuadro rectangular (poligonal, paralelogramo) a nivel de columna, transcripción de contenido a nivel de columna; anotación de cuadro no vertical (poligonal, paralelogramo), transcripción de contenido no vertical"},{"@type":"PropertyValue","name":"Precisión","value":"Se detecta correctamente una desviación del vértice de la caja de marcadores no superior a tres píxeles, y la precisión de la caja de detección no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%"}]
{"id":1226,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"57.645 imágenes datos OCR escenas texto vertical","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"57.645 imágenes, 528.553 cuadros"},{"title":"Entorno de captura","desc":"Entorno de captura","content":"Incluye vistas callejeras, rótulos, vallas publicitarias, carteles, decoraciones, tipografía artística, portadas de revistas, etc."},{"title":"Diversidad de captura","desc":"Diversidad de captura","content":"Múltiples escenarios, múltiples tipografías"},{"title":"Distribución lingüística","desc":"Distribución lingüística","content":"Chino, inglés (poca cantidad)"},{"title":"Distribución de la dirección del marco de anotación","desc":"Distribución de la dirección del marco de anotación","content":"324.399 cuadros verticales, 204.154 cuadros no verticales"},{"title":"Distribución de las formas de los recuadros de marcado","desc":"Distribución de las formas de los recuadros de marcado","content":"34.936 casillas rectangulares, 220.716 casillas poligonales, 272.901 casillas paralelogramos"},{"title":"Formato de datos","desc":"Formato de datos","content":"El formato de los datos de imagen es .jpg, y el formato del archivo de anotación es .json."},{"title":"Contenido de etiquetado","desc":"Contenido de etiquetado","content":"Anotación de cuadro rectangular (poligonal, paralelogramo) a nivel de columna, transcripción de contenido a nivel de columna; anotación de cuadro no vertical (poligonal, paralelogramo), transcripción de contenido no vertical"},{"title":"Precisión","desc":"Precisión","content":"Se detecta correctamente una desviación del vértice de la caja de marcadores no superior a tres píxeles, y la precisión de la caja de detección no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%"}],"datatag":"OCR,Multiple scenes,Multiple fonts","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054889_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=tDNg2Jmp1JEEZiTMQB2hIFr17SI%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056472_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=sGLSMlt8%2BocGKzLN0YYIgRrTg78%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/054886_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2t3vBygA4k0HDuTQq9h%2ByOBmO8E%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"57.645 datos OCR de escenas de texto verticales. Las escenas de la colección incluyen escenas de calles, placas, vallas publicitarias, carteles, decoraciones, caracteres artísticos, portadas de revistas, etc. La distribución lingüística es china e inglesa (unas pocas). En cuanto a las anotaciones, se pueden realizar anotaciones en cajas rectangulares a nivel de columna (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido a nivel de columna; anotaciones en cajas rectangulares no verticales (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido no verticales. Este conjunto de datos puede utilizarse para diversas tareas de OCR de escenas de texto verticales.","dataexampl":null,"datakeyword":["Datos OCR escenas texto vertical"," Datos imagen OCR"," Datos OCR"," Conjunto datos OCR"," Anotación OCR"," Adquisición OCR"," Procesamiento datos OCR"," Datos reescritura OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"57,645 Images - Vertical OCR Data in Text Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230117001_demo1695809214287/APY230117001_demo/056480_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2d2r3%2FYQASEMnhCBsTgJBTu2y74%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
57.645 datos OCR de escenas de texto verticales. Las escenas de la colección incluyen escenas de calles, placas, vallas publicitarias, carteles, decoraciones, caracteres artísticos, portadas de revistas, etc. La distribución lingüística es china e inglesa (unas pocas). En cuanto a las anotaciones, se pueden realizar anotaciones en cajas rectangulares a nivel de columna (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido a nivel de columna; anotaciones en cajas rectangulares no verticales (cajas poligonales, cajas de paralelogramo) y transcripciones de contenido no verticales. Este conjunto de datos puede utilizarse para diversas tareas de OCR de escenas de texto verticales.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Escala de datos
57.645 imágenes, 528.553 cuadros
Entorno de captura
Incluye vistas callejeras, rótulos, vallas publicitarias, carteles, decoraciones, tipografía artística, portadas de revistas, etc.
Diversidad de captura
Múltiples escenarios, múltiples tipografías
Distribución lingüística
Chino, inglés (poca cantidad)
Distribución de la dirección del marco de anotación
324.399 cuadros verticales, 204.154 cuadros no verticales
Distribución de las formas de los recuadros de marcado
El formato de los datos de imagen es .jpg, y el formato del archivo de anotación es .json.
Contenido de etiquetado
Anotación de cuadro rectangular (poligonal, paralelogramo) a nivel de columna, transcripción de contenido a nivel de columna; anotación de cuadro no vertical (poligonal, paralelogramo), transcripción de contenido no vertical
Precisión
Se detecta correctamente una desviación del vértice de la caja de marcadores no superior a tres píxeles, y la precisión de la caja de detección no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%