[{"@type":"PropertyValue","name":"Escala de datos","value":"105.941 imágenes, incluyendo familia asiática: 9.997 imágenes en japonés, 10.231 imágenes en coreano, 7.591 imágenes en indonesio, 5.650 imágenes en malayo, 8.822 imágenes en vietnamita, 9.645 imágenes en tailandés; familia europea: 10.015 imágenes en francés, 7.213 imágenes en alemán, 8.824 imágenes en italiano, 7.754 imágenes en portugués, 10.376 imágenes en ruso, 9.823 imágenes en español"},{"@type":"PropertyValue","name":"Entorno de captura","value":"Incluye rótulos comerciales, paradas, carteles, tickets, señales, cómics, tapas de alcantarilla, frases informativas, advertencias, empaques, menús, señales edificatorias, etc."},{"@type":"PropertyValue","name":"Diversidad de captura","value":"Incluye 12 idiomas, múltiples escenas de naturaleza, múltiples ángulos de cámara (vista inferior, vista superior, visión normal)"},{"@type":"PropertyValue","name":"Equipos de captura","value":"Teléfonos móviles, cámaras"},{"@type":"PropertyValue","name":"Parámetros de imagen","value":"El formato de imagen es .jpg, el formato de anotación es .json"},{"@type":"PropertyValue","name":"Contenido de etiquetado","value":"Marcado de cuadriláteros a nivel de línea, transcripción de contenidos a nivel de línea"},{"@type":"PropertyValue","name":"Precisión","value":"Se detecta correctamente una desviación del vértice de la caja cuadrangular de no más de cinco píxeles; la precisión de la detección de la caja no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%."}]
{"id":1064,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"105.941 imágenes datos OCR 12 idiomas escenas naturales","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"105.941 imágenes, incluyendo familia asiática: 9.997 imágenes en japonés, 10.231 imágenes en coreano, 7.591 imágenes en indonesio, 5.650 imágenes en malayo, 8.822 imágenes en vietnamita, 9.645 imágenes en tailandés; familia europea: 10.015 imágenes en francés, 7.213 imágenes en alemán, 8.824 imágenes en italiano, 7.754 imágenes en portugués, 10.376 imágenes en ruso, 9.823 imágenes en español"},{"title":"Entorno de captura","desc":"Entorno de captura","content":"Incluye rótulos comerciales, paradas, carteles, tickets, señales, cómics, tapas de alcantarilla, frases informativas, advertencias, empaques, menús, señales edificatorias, etc."},{"title":"Diversidad de captura","desc":"Diversidad de captura","content":"Incluye 12 idiomas, múltiples escenas de naturaleza, múltiples ángulos de cámara (vista inferior, vista superior, visión normal)"},{"title":"Equipos de captura","desc":"Equipos de captura","content":"Teléfonos móviles, cámaras"},{"title":"Parámetros de imagen","desc":"Parámetros de imagen","content":"El formato de imagen es .jpg, el formato de anotación es .json"},{"title":"Contenido de etiquetado","desc":"Contenido de etiquetado","content":"Marcado de cuadriláteros a nivel de línea, transcripción de contenidos a nivel de línea"},{"title":"Precisión","desc":"Precisión","content":"Se detecta correctamente una desviación del vértice de la caja cuadrangular de no más de cinco píxeles; la precisión de la detección de la caja no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%."}],"datatag":"12 languages,Multiple photographic angles,Multiple scenes,Line-level quadrilateral bounding box annotation and transcription","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=TafXJxAg8o5Kg%2BGun3KIiEjsu%2BU%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9arI65%2BOzsdy2xK7XZfBGqmQ2og%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2FiYq03v6ZQCDTNsEE6fB5DmAkGk%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Los 105.941 datos OCR de escenas naturales abarcan 12 idiomas, incluidos 6 idiomas asiáticos y 6 idiomas europeos, y la colección cubre una variedad de escenas naturales y una variedad de ángulos de toma. En cuanto a la anotación, se etiquetan los cuadros cuadriláteros de texto a nivel de línea y se transcribe el texto a nivel de línea. Este conjunto de datos puede utilizarse para tareas de OCR multilingüe.","dataexampl":null,"datakeyword":["Japonés"," Coreano"," Indonesio"," Malayo"," Vietnamita"," Tailandés"," Francés"," Alemán"," Italiano"," Portugués"," Ruso"," Español"," OCR"," escenas naturales"," múltiples ángulos fotográficos"," anotación cuadrilátero nivel línea y transcripción para textos"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"105,941 Images Natural Scenes OCR Data of 12 Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ieEtznzUAUiNqtvqirs%2F8uIwe8Y%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
105.941 imágenes datos OCR 12 idiomas escenas naturales
Japonés
Coreano
Indonesio
Malayo
Vietnamita
Tailandés
Francés
Alemán
Italiano
Portugués
Ruso
Español
OCR
escenas naturales
múltiples ángulos fotográficos
anotación cuadrilátero nivel línea y transcripción para textos
Los 105.941 datos OCR de escenas naturales abarcan 12 idiomas, incluidos 6 idiomas asiáticos y 6 idiomas europeos, y la colección cubre una variedad de escenas naturales y una variedad de ángulos de toma. En cuanto a la anotación, se etiquetan los cuadros cuadriláteros de texto a nivel de línea y se transcribe el texto a nivel de línea. Este conjunto de datos puede utilizarse para tareas de OCR multilingüe.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Escala de datos
105.941 imágenes, incluyendo familia asiática: 9.997 imágenes en japonés, 10.231 imágenes en coreano, 7.591 imágenes en indonesio, 5.650 imágenes en malayo, 8.822 imágenes en vietnamita, 9.645 imágenes en tailandés; familia europea: 10.015 imágenes en francés, 7.213 imágenes en alemán, 8.824 imágenes en italiano, 7.754 imágenes en portugués, 10.376 imágenes en ruso, 9.823 imágenes en español
Entorno de captura
Incluye rótulos comerciales, paradas, carteles, tickets, señales, cómics, tapas de alcantarilla, frases informativas, advertencias, empaques, menús, señales edificatorias, etc.
Diversidad de captura
Incluye 12 idiomas, múltiples escenas de naturaleza, múltiples ángulos de cámara (vista inferior, vista superior, visión normal)
Equipos de captura
Teléfonos móviles, cámaras
Parámetros de imagen
El formato de imagen es .jpg, el formato de anotación es .json
Contenido de etiquetado
Marcado de cuadriláteros a nivel de línea, transcripción de contenidos a nivel de línea
Precisión
Se detecta correctamente una desviación del vértice de la caja cuadrangular de no más de cinco píxeles; la precisión de la detección de la caja no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%.