[{"@type":"PropertyValue","name":"Escala de datos","value":"500,000 imágenes, distribución de 20,000 a 25,000 imágenes por idioma"},{"@type":"PropertyValue","name":"Distribución de idiomas","value":"Alemán, Francés, Portugués, Italiano, Español, Indonesio, Ruso, Japonés, Coreano, Vietnamita, Polaco, Checo, Turco, Filipino, Neerlandés, Hindi, Malayo, Kazajo, Eslovaco, Rumano, Uzbeko"},{"@type":"PropertyValue","name":"Entorno de recolección","value":"Escenas de fotos de documentos: libros, periódicos, varios tipos de tarjetas, tickets, etc.; Escenas naturales: carteles, señales de advertencia, señales de tráfico, envases de alimentos, vallas publicitarias, paradas de autobús, letreros, etc.; Escenas electrónicas: capturas de pantalla de móviles, capturas de pantalla de computadoras, documentos electrónicos"},{"@type":"PropertyValue","name":"Diversidad de recolección","value":"Múltiples tipos de datos, múltiples ángulos de captura, múltiples idiomas"},{"@type":"PropertyValue","name":"Dispositivos de recolección","value":"Teléfono móvil, computadora"},{"@type":"PropertyValue","name":"Formatos de datos","value":"El formato de imagen es .jpg y otros formatos comunes, el formato del documento de anotación es .json"},{"@type":"PropertyValue","name":"Contenido de la anotación","value":"Anotación a nivel de fila (columna) con cuadriláteros o polígonos, transcripción de contenido a nivel de fila (columna)"},{"@type":"PropertyValue","name":"Precisión","value":"La precisión del cuadro de detección a nivel de fila no es inferior al 97%, se considera una anotación correcta si la división de filas es correcta y la desviación en los cuatro lados no supera los 5 píxeles; La precisión de la transcripción a nivel de fila y de carácter no es inferior al 97%."}]
{"id":1862,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"500,000 imágenes, distribución de 20,000 a 25,000 imágenes por idioma"},{"title":"Distribución de idiomas","desc":"Distribución de idiomas","content":"Alemán, Francés, Portugués, Italiano, Español, Indonesio, Ruso, Japonés, Coreano, Vietnamita, Polaco, Checo, Turco, Filipino, Neerlandés, Hindi, Malayo, Kazajo, Eslovaco, Rumano, Uzbeko"},{"title":"Entorno de recolección","desc":"Entorno de recolección","content":"Escenas de fotos de documentos: libros, periódicos, varios tipos de tarjetas, tickets, etc.; Escenas naturales: carteles, señales de advertencia, señales de tráfico, envases de alimentos, vallas publicitarias, paradas de autobús, letreros, etc.; Escenas electrónicas: capturas de pantalla de móviles, capturas de pantalla de computadoras, documentos electrónicos"},{"title":"Diversidad de recolección","desc":"Diversidad de recolección","content":"Múltiples tipos de datos, múltiples ángulos de captura, múltiples idiomas"},{"title":"Dispositivos de recolección","desc":"Dispositivos de recolección","content":"Teléfono móvil, computadora"},{"title":"Formatos de datos","desc":"Formatos de datos","content":"El formato de imagen es .jpg y otros formatos comunes, el formato del documento de anotación es .json"},{"title":"Contenido de la anotación","desc":"Contenido de la anotación","content":"Anotación a nivel de fila (columna) con cuadriláteros o polígonos, transcripción de contenido a nivel de fila (columna)"},{"title":"Precisión","desc":"Precisión","content":"La precisión del cuadro de detección a nivel de fila no es inferior al 97%, se considera una anotación correcta si la división de filas es correcta y la desviación en los cuatro lados no supera los 5 píxeles; La precisión de la transcripción a nivel de fila y de carácter no es inferior al 97%."}],"datatag":"OCR,21 countries,Natural Scenes,Document Photograph Scenes,Electronic Scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países. Los datos incluyen 21 idiomas, con una distribución de 20,000 a 25,000 imágenes por idioma. Los tipos de datos incluyen escenas naturales, escenas de fotos de documentos y escenas electrónicas. La diversidad de datos incluye múltiples tipos de datos, múltiples ángulos de captura y múltiples idiomas. En cuanto a la anotación, se utiliza anotación a nivel de fila (columna) con cuadriláteros o polígonos y transcripción de contenido a nivel de fila (columna). Los datos pueden utilizarse para tareas de reconocimiento OCR multilingüe.","dataexampl":null,"datakeyword":["Conjunto de datos OCR multilingüe"," datos de reconocimiento de texto en escenas"," conjunto de datos OCR de documentos"," datos OCR de pantallas electrónicas"," conjunto de datos OCR 21 idiomas"," datos de entrenamiento OCR para IA"," conjunto de datos de reconocimiento de texto"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"500,000 Images - Natural Scenes & Document Photograph Scenes & Electronic Scenes OCR Data of 21 Countries","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países
Conjunto de datos OCR multilingüe
datos de reconocimiento de texto en escenas
conjunto de datos OCR de documentos
datos OCR de pantallas electrónicas
conjunto de datos OCR 21 idiomas
datos de entrenamiento OCR para IA
conjunto de datos de reconocimiento de texto
500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países. Los datos incluyen 21 idiomas, con una distribución de 20,000 a 25,000 imágenes por idioma. Los tipos de datos incluyen escenas naturales, escenas de fotos de documentos y escenas electrónicas. La diversidad de datos incluye múltiples tipos de datos, múltiples ángulos de captura y múltiples idiomas. En cuanto a la anotación, se utiliza anotación a nivel de fila (columna) con cuadriláteros o polígonos y transcripción de contenido a nivel de fila (columna). Los datos pueden utilizarse para tareas de reconocimiento OCR multilingüe.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Escala de datos
500,000 imágenes, distribución de 20,000 a 25,000 imágenes por idioma
Escenas de fotos de documentos: libros, periódicos, varios tipos de tarjetas, tickets, etc.; Escenas naturales: carteles, señales de advertencia, señales de tráfico, envases de alimentos, vallas publicitarias, paradas de autobús, letreros, etc.; Escenas electrónicas: capturas de pantalla de móviles, capturas de pantalla de computadoras, documentos electrónicos
Diversidad de recolección
Múltiples tipos de datos, múltiples ángulos de captura, múltiples idiomas
Dispositivos de recolección
Teléfono móvil, computadora
Formatos de datos
El formato de imagen es .jpg y otros formatos comunes, el formato del documento de anotación es .json
Contenido de la anotación
Anotación a nivel de fila (columna) con cuadriláteros o polígonos, transcripción de contenido a nivel de fila (columna)
Precisión
La precisión del cuadro de detección a nivel de fila no es inferior al 97%, se considera una anotación correcta si la división de filas es correcta y la desviación en los cuatro lados no supera los 5 píxeles; La precisión de la transcripción a nivel de fila y de carácter no es inferior al 97%.