[{"@type":"PropertyValue","name":"Escala de datos","value":"3.506 imágenes: 2.056 escenas naturales, 1.103 textos en imágenes de internet, 347 imágenes de texto"},{"@type":"PropertyValue","name":"Entorno de captura","value":"Escenas naturales (placas, descripciones de envases, pequeños anuncios, menús, carteles, etc.), imágenes de Internet (portadas de revistas, portadas de cómics, etc.), imágenes de texto (documentos de texto, etc.)"},{"@type":"PropertyValue","name":"Diversidad de captura","value":"Incluye múltiples escenas, múltiples ángulos y diferentes condiciones de iluminación"},{"@type":"PropertyValue","name":"Equipos de captura","value":"Teléfonos móviles"},{"@type":"PropertyValue","name":"Ángulo de captura","value":"Vista inferior, visión normal"},{"@type":"PropertyValue","name":"Formato de datos","value":"El formato de la imagen es .jpg y el del documento de anotación es .json."},{"@type":"PropertyValue","name":"Contenido de etiquetado","value":"Marcado de cuadriláteros a nivel de línea, transcripción de contenidos a nivel de línea; etiquetado de cuadriláteros a nivel de columna vertical, transcripción de contenidos a nivel de columna vertical"},{"@type":"PropertyValue","name":"Precisión","value":"Se detecta correctamente una desviación de los vértices de la caja cuadrangular no superior a 10 píxeles; la precisión de la detección de la caja no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%."}]
{"id":1058,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"3.506 imágenes datos OCR hindi: anotación + transcripción","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"3.506 imágenes: 2.056 escenas naturales, 1.103 textos en imágenes de internet, 347 imágenes de texto"},{"title":"Entorno de captura","desc":"Entorno de captura","content":"Escenas naturales (placas, descripciones de envases, pequeños anuncios, menús, carteles, etc.), imágenes de Internet (portadas de revistas, portadas de cómics, etc.), imágenes de texto (documentos de texto, etc.)"},{"title":"Diversidad de captura","desc":"Diversidad de captura","content":"Incluye múltiples escenas, múltiples ángulos y diferentes condiciones de iluminación"},{"title":"Equipos de captura","desc":"Equipos de captura","content":"Teléfonos móviles"},{"title":"Ángulo de captura","desc":"Ángulo de captura","content":"Vista inferior, visión normal"},{"title":"Formato de datos","desc":"Formato de datos","content":"El formato de la imagen es .jpg y el del documento de anotación es .json."},{"title":"Contenido de etiquetado","desc":"Contenido de etiquetado","content":"Marcado de cuadriláteros a nivel de línea, transcripción de contenidos a nivel de línea; etiquetado de cuadriláteros a nivel de columna vertical, transcripción de contenidos a nivel de columna vertical"},{"title":"Precisión","desc":"Precisión","content":"Se detecta correctamente una desviación de los vértices de la caja cuadrangular no superior a 10 píxeles; la precisión de la detección de la caja no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%."}],"datatag":"Hindi OCR,Multiple scenes,Multiple angles,Different light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1RHyBQ877xadK9qW66Lj6Ivikq0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZYCVjKlMLMjdYWQ17c9BpniCAa0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=p8LQVuz%2BoHuw%2BP8mwBwq45M3q9Q%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"3.506 imágenes de datos de OCR en hindi anotados y transcritos incluyen 2.056 imágenes naturales, 1.103 de internet, 347 de texto. Anotación: Contenido por línea: caja delimitadora cuadrilátera por línea, transcripción por línea; Contenido vertical: caja delimitadora cuadrilátera vertical, transcripción vertical. Este conjunto de datos de OCR en hindi anotados y transcritos puede usarse para reconocimiento de hindi en múltiples escenarios, traducción fotográfica de hindi, etc.","dataexampl":null,"datakeyword":["Hindi"," OCR"," imágenes documentos"," imágenes internet"," escenas naturales"," múltiples ángulos"," diferentes condiciones luz"," anotación cuadrilátero delimitador"," transcripción nivel línea textos"," transcripción nivel columna textos"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"3,506 Hindi OCR Images Data - Images with Annotation and Transcription","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VNNczsPK38IDN%2F2BxuBFYMdpzBc%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
3.506 imágenes datos OCR hindi: anotación + transcripción
Hindi
OCR
imágenes documentos
imágenes internet
escenas naturales
múltiples ángulos
diferentes condiciones luz
anotación cuadrilátero delimitador
transcripción nivel línea textos
transcripción nivel columna textos
3.506 imágenes de datos de OCR en hindi anotados y transcritos incluyen 2.056 imágenes naturales, 1.103 de internet, 347 de texto. Anotación: Contenido por línea: caja delimitadora cuadrilátera por línea, transcripción por línea; Contenido vertical: caja delimitadora cuadrilátera vertical, transcripción vertical. Este conjunto de datos de OCR en hindi anotados y transcritos puede usarse para reconocimiento de hindi en múltiples escenarios, traducción fotográfica de hindi, etc.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Escala de datos
3.506 imágenes: 2.056 escenas naturales, 1.103 textos en imágenes de internet, 347 imágenes de texto
Entorno de captura
Escenas naturales (placas, descripciones de envases, pequeños anuncios, menús, carteles, etc.), imágenes de Internet (portadas de revistas, portadas de cómics, etc.), imágenes de texto (documentos de texto, etc.)
Diversidad de captura
Incluye múltiples escenas, múltiples ángulos y diferentes condiciones de iluminación
Equipos de captura
Teléfonos móviles
Ángulo de captura
Vista inferior, visión normal
Formato de datos
El formato de la imagen es .jpg y el del documento de anotación es .json.
Contenido de etiquetado
Marcado de cuadriláteros a nivel de línea, transcripción de contenidos a nivel de línea; etiquetado de cuadriláteros a nivel de columna vertical, transcripción de contenidos a nivel de columna vertical
Precisión
Se detecta correctamente una desviación de los vértices de la caja cuadrangular no superior a 10 píxeles; la precisión de la detección de la caja no es inferior al 97%; la precisión de la transcripción del texto no es inferior al 97%.