[{"@type":"PropertyValue","name":"Escala de datos","value":"Coreano 76.861 imágenes, 555.913 cuadros; hindi 27.459 imágenes, 200.453 cuadros"},{"@type":"PropertyValue","name":"Entorno de captura","value":"Incluye empaques comerciales, carteles, tickets, frases informativas, menús, señales edificatorias, etc."},{"@type":"PropertyValue","name":"Diversidad de captura","value":"Múltiples escenarios naturales, múltiples ángulos de captura, diferentes condiciones de iluminación"},{"@type":"PropertyValue","name":"Equipos de captura","value":"Teléfonos móviles"},{"@type":"PropertyValue","name":"Ángulo","value":"Vista inferior, vista superior, visión normal"},{"@type":"PropertyValue","name":"Distribución lingüística","value":"Coreano, hindi, inglés (poca cantidad)"},{"@type":"PropertyValue","name":"Formato de datos","value":"El formato de imagen es .jpg y el formato de archivo de anotación es .json."},{"@type":"PropertyValue","name":"Distribución de las formas de los recuadros de marcado","value":"Coreano 315.822 casillas cuadriláteras, 240.091 casillas poligonales; hindi 780 casillas cuadriláteras, 199.671 casillas poligonales, 2 casillas rectangulares"},{"@type":"PropertyValue","name":"Contenido de etiquetado","value":"Anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de línea/fila, transcripción de contenido, atributos de texto (idioma); anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de columna, transcripción de contenido, atributos de texto (idioma)"},{"@type":"PropertyValue","name":"Precisión","value":"Se detecta correctamente una desviación del vértice del recuadro de marcado no superior a cinco píxeles, la precisión del recuadro de detección no es inferior al 95%; la precisión de la transcripción del texto no es inferior al 95%"}]
{"id":1254,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"104.320 imágenes datos OCR escenas naturales coreano-hindi","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"Coreano 76.861 imágenes, 555.913 cuadros; hindi 27.459 imágenes, 200.453 cuadros"},{"title":"Entorno de captura","desc":"Entorno de captura","content":"Incluye empaques comerciales, carteles, tickets, frases informativas, menús, señales edificatorias, etc."},{"title":"Diversidad de captura","desc":"Diversidad de captura","content":"Múltiples escenarios naturales, múltiples ángulos de captura, diferentes condiciones de iluminación"},{"title":"Equipos de captura","desc":"Equipos de captura","content":"Teléfonos móviles"},{"title":"Ángulo","desc":"Ángulo","content":"Vista inferior, vista superior, visión normal"},{"title":"Distribución lingüística","desc":"Distribución lingüística","content":"Coreano, hindi, inglés (poca cantidad)"},{"title":"Formato de datos","desc":"Formato de datos","content":"El formato de imagen es .jpg y el formato de archivo de anotación es .json."},{"title":"Distribución de las formas de los recuadros de marcado","desc":"Distribución de las formas de los recuadros de marcado","content":"Coreano 315.822 casillas cuadriláteras, 240.091 casillas poligonales; hindi 780 casillas cuadriláteras, 199.671 casillas poligonales, 2 casillas rectangulares"},{"title":"Contenido de etiquetado","desc":"Contenido de etiquetado","content":"Anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de línea/fila, transcripción de contenido, atributos de texto (idioma); anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de columna, transcripción de contenido, atributos de texto (idioma)"},{"title":"Precisión","desc":"Precisión","content":"Se detecta correctamente una desviación del vértice del recuadro de marcado no superior a cinco píxeles, la precisión del recuadro de detección no es inferior al 95%; la precisión de la transcripción del texto no es inferior al 95%"}],"datatag":"Multiple natural scenes,Multiple shooting angles,Multiple light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1xXx3CKukYZpXUoWeGQa3UM5%2F5A%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=k36XqpwImWbppq62S04QPeMPSEA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=zyhyQSDYy6jTbpF3nc4f%2F09ufT4%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"104.320 datos OCR de escenas naturales en coreano e hindi. Escenarios de recopilación incluyen empaques de productos, carteles, boletos de transporte, letreros informativos, menús, señales de edificios, etc. Diversidad: múltiples escenarios, ángulos de captura, condiciones de iluminación. Distribución lingüística: coreano, hindi e inglés (pequeña cantidad). En anotaciones: Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de línea, transcripción de contenido a nivel de línea, atributos de texto (tipo de idioma); Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de columna, transcripción de contenido a nivel de columna, atributos de texto (tipo de idioma). Este conjunto de datos OCR de escenas naturales en coreano e hindi puede usarse para tareas OCR en escenas naturales coreanas e hindúes.","dataexampl":null,"datakeyword":["Coreano"," Hindi"," Datos OCR"," Escena natural"," Datos transliteración OCR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"104,320 Images - Korean and Hindi OCR Data in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=59499xW%2FRbwxe18fQPgO5cjSQFE%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
104.320 imágenes datos OCR escenas naturales coreano-hindi
Coreano
Hindi
Datos OCR
Escena natural
Datos transliteración OCR
104.320 datos OCR de escenas naturales en coreano e hindi. Escenarios de recopilación incluyen empaques de productos, carteles, boletos de transporte, letreros informativos, menús, señales de edificios, etc. Diversidad: múltiples escenarios, ángulos de captura, condiciones de iluminación. Distribución lingüística: coreano, hindi e inglés (pequeña cantidad). En anotaciones: Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de línea, transcripción de contenido a nivel de línea, atributos de texto (tipo de idioma); Anotación de caja poligonal (o cuadrilátero, rectángulo) a nivel de columna, transcripción de contenido a nivel de columna, atributos de texto (tipo de idioma). Este conjunto de datos OCR de escenas naturales en coreano e hindi puede usarse para tareas OCR en escenas naturales coreanas e hindúes.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Escala de datos
Coreano 76.861 imágenes, 555.913 cuadros; hindi 27.459 imágenes, 200.453 cuadros
Anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de línea/fila, transcripción de contenido, atributos de texto (idioma); anotación de cuadro poligonal (o cuadrilátero, rectangular) a nivel de columna, transcripción de contenido, atributos de texto (idioma)
Precisión
Se detecta correctamente una desviación del vértice del recuadro de marcado no superior a cinco píxeles, la precisión del recuadro de detección no es inferior al 95%; la precisión de la transcripción del texto no es inferior al 95%