[{"@type":"PropertyValue","name":"Escala de datos","value":"30.000 imágenes: jemer (Camboya) 10.000. laosiano 10.000. birmano 10.000"},{"@type":"PropertyValue","name":"Entorno de captura","value":"Lematones, tickets, carteles, advertencias, señales viales, empaques alimenticios, vallas publicitarias, paradas y letreros, etc."},{"@type":"PropertyValue","name":"Diversidad de captura","value":"Múltiples escenas de naturaleza, múltiples ángulos de disparo"},{"@type":"PropertyValue","name":"Equipos de captura","value":"Teléfonos móviles"},{"@type":"PropertyValue","name":"Ángulo","value":"Vista inferior, vista superior, visión normal"},{"@type":"PropertyValue","name":"Formato de datos","value":"El formato de imagen es .jpg y otros formatos comunes para imágenes, y el formato del documento de anotación es .json"},{"@type":"PropertyValue","name":"Contenido de etiquetado","value":"Anotación de cuadrilátero a nivel de línea/columna, transcripción; anotación poligonal, transcripción"},{"@type":"PropertyValue","name":"Precisión","value":"Se detecta correctamente una desviación de los vértices de una caja cuadrangular o poligonal no superior a cinco píxeles; la precisión de la detección de la caja no es inferior al 95%; la precisión de la transcripción del texto no es inferior al 95%"}]
{"id":1758,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"30.000 imágenes de datos OCR de escenas naturales en idiomas minoritarios del sudeste asiático","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"30.000 imágenes: jemer (Camboya) 10.000. laosiano 10.000. birmano 10.000"},{"title":"Entorno de captura","desc":"Entorno de captura","content":"Lematones, tickets, carteles, advertencias, señales viales, empaques alimenticios, vallas publicitarias, paradas y letreros, etc."},{"title":"Diversidad de captura","desc":"Diversidad de captura","content":"Múltiples escenas de naturaleza, múltiples ángulos de disparo"},{"title":"Equipos de captura","desc":"Equipos de captura","content":"Teléfonos móviles"},{"title":"Ángulo","desc":"Ángulo","content":"Vista inferior, vista superior, visión normal"},{"title":"Formato de datos","desc":"Formato de datos","content":"El formato de imagen es .jpg y otros formatos comunes para imágenes, y el formato del documento de anotación es .json"},{"title":"Contenido de etiquetado","desc":"Contenido de etiquetado","content":"Anotación de cuadrilátero a nivel de línea/columna, transcripción; anotación poligonal, transcripción"},{"title":"Precisión","desc":"Precisión","content":"Se detecta correctamente una desviación de los vértices de una caja cuadrangular o poligonal no superior a cinco píxeles; la precisión de la detección de la caja no es inferior al 95%; la precisión de la transcripción del texto no es inferior al 95%"}],"datatag":"OCR,Southeast Asian Languages,Natural Scenes,Document Photograph,Electronic Scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"000403_Khmer.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/000403_Khmer.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=L2J7muvDBy0QPwH2rM1u6k6w5JM%3D","intro":"","size":227016,"progress":100,"type":"jpg"},{"name":"002617_Khmer.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/002617_Khmer.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ROYTGM4k6aYF0orFqlmCCSxQMx8%3D","intro":"","size":9170388,"progress":100,"type":"jpg"},{"name":"016759_Burmese.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/016759_Burmese.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=XBOxiiJt6plkUNjHNn3x3FcjZ1k%3D","intro":"","size":1105131,"progress":100,"type":"jpg"}],"officialSummary":"30.000 imágenes de datos OCR de escenas naturales en idiomas minoritarios del sudeste asiático, que incluyen 3 idiomas: jemer (Camboya), laosiano y birmano. La diversidad de captura incluye múltiples escenas naturales, múltiples ángulos de toma. Este conjunto de datos puede usarse para tareas OCR de idiomas del sudeste asiático.","dataexampl":null,"datakeyword":["OCR"," Lenguas sudeste asiático"," Escenas naturales"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"29,954 Images - OCR Collection Data in Southeast Asian Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"030294_Laos.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/030294_Laos.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eJt2N7fokJRVZfF9OWTx3%2BOWy0A%3D","intro":"","size":8952795,"progress":100,"type":"jpg"}]}
30.000 imágenes de datos OCR de escenas naturales en idiomas minoritarios del sudeste asiático
OCR
Lenguas sudeste asiático
Escenas naturales
30.000 imágenes de datos OCR de escenas naturales en idiomas minoritarios del sudeste asiático, que incluyen 3 idiomas: jemer (Camboya), laosiano y birmano. La diversidad de captura incluye múltiples escenas naturales, múltiples ángulos de toma. Este conjunto de datos puede usarse para tareas OCR de idiomas del sudeste asiático.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Lematones, tickets, carteles, advertencias, señales viales, empaques alimenticios, vallas publicitarias, paradas y letreros, etc.
Diversidad de captura
Múltiples escenas de naturaleza, múltiples ángulos de disparo
Equipos de captura
Teléfonos móviles
Ángulo
Vista inferior, vista superior, visión normal
Formato de datos
El formato de imagen es .jpg y otros formatos comunes para imágenes, y el formato del documento de anotación es .json
Contenido de etiquetado
Anotación de cuadrilátero a nivel de línea/columna, transcripción; anotación poligonal, transcripción
Precisión
Se detecta correctamente una desviación de los vértices de una caja cuadrangular o poligonal no superior a cinco píxeles; la precisión de la detección de la caja no es inferior al 95%; la precisión de la transcripción del texto no es inferior al 95%