[{"@type":"PropertyValue","name":"Escala de datos","value":"1.998 personas, mínimo 14 segmentos de video por individuo, totalizando 41.866 segmentos de video"},{"@type":"PropertyValue","name":"Distribución por edad","value":"Desde adolescentes hasta ancianos, con predominio de adultos jóvenes y de mediana edad"},{"@type":"PropertyValue","name":"Entorno de captura","value":"Escenario interior"},{"@type":"PropertyValue","name":"Diversidad de captura","value":"Múltiples escenarios; distintos períodos temporales; diversos grupos de edad"},{"@type":"PropertyValue","name":"Equipos de captura","value":"Teléfonos móviles (cámara frontal), resolución 640 * 480 píxeles"},{"@type":"PropertyValue","name":"Ángulo de captura","value":"Frontal"},{"@type":"PropertyValue","name":"Formato de datos","value":"El formato de los datos de vídeo es .mp4"},{"@type":"PropertyValue","name":"Contenido de captura","value":"Videos de lectura labial con pronunciación de 8 dígitos arábigos"},{"@type":"PropertyValue","name":"Precisión","value":"La exactitud de la anotación de etiquetas para el tiempo de grabación de video y el contenido leído no es inferior al 95%"}]
{"id":2,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"149","type2str":null,"dataname":"1.998 personas de datos de vídeo lectura labial","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"1.998 personas, mínimo 14 segmentos de video por individuo, totalizando 41.866 segmentos de video"},{"title":"Distribución por edad","desc":"Distribución por edad","content":"Desde adolescentes hasta ancianos, con predominio de adultos jóvenes y de mediana edad"},{"title":"Entorno de captura","desc":"Entorno de captura","content":"Escenario interior"},{"title":"Diversidad de captura","desc":"Diversidad de captura","content":"Múltiples escenarios; distintos períodos temporales; diversos grupos de edad"},{"title":"Equipos de captura","desc":"Equipos de captura","content":"Teléfonos móviles (cámara frontal), resolución 640 * 480 píxeles"},{"title":"Ángulo de captura","desc":"Ángulo de captura","content":"Frontal"},{"title":"Formato de datos","desc":"Formato de datos","content":"El formato de los datos de vídeo es .mp4"},{"title":"Contenido de captura","desc":"Contenido de captura","content":"Videos de lectura labial con pronunciación de 8 dígitos arábigos"},{"title":"Precisión","desc":"Precisión","content":"La exactitud de la anotación de etiquetas para el tiempo de grabación de video y el contenido leído no es inferior al 95%"}],"datatag":"Lip Language,Faces,Multiple scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"V11_20150707143451_25252325.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/asset/productNew/20240919105750046_V11_20150707143451_25252325.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=KMOv37ykkgd12HPInH0U6L3m%2FtQ%3D","intro":"","size":0,"progress":100,"type":"mp4"},{"name":"V11_20150707143503_60962380.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/asset/productNew/20240919105816146_V11_20150707143503_60962380.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=huHx5%2B1mG%2BwfAYL5kF780DxWhKE%3D","intro":"","size":0,"progress":100,"type":"mp4"},{"name":"V11_20150707165235_23535256.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/asset/productNew/20240919105850489_V11_20150707165235_23535256.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=At3PPAwJ8Gu3NBOeyAC7qfCRTnE%3D","intro":"","size":0,"progress":100,"type":"mp4"}],"officialSummary":"El Conjunto de Datos de Video de Lectura Labial de 1.998 Personas abarca múltiples escenarios, diversos grupos de edad y distintos períodos temporales. En cada segmento de video, los participantes pronuncian secuencias de 8 dígitos arábigos mediante movimientos labiales. El dataset contiene 41.866 segmentos de video, con una duración total de 86 horas, 56 minutos y 1,52 segundos. Este recurso es aplicable en tareas de Detección de Vivacidad y Reconocimiento de Labios.","dataexampl":null,"datakeyword":["Lectura Labial; Datos de Video; Escenarios Múltiples"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Task Type,Modalities","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"computer","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1,998 People - Lip Language Video Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"v1120150714183334_52545456.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/asset/productNew/20240919105902318_v1120150714183334_52545456.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2cklyiKqtZdXzTCo0O5zB9j1ISE%3D","intro":"","size":0,"progress":100,"type":"mp4"},{"name":"v1120150715073914_92525858.mp4","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/asset/productNew/20240919105922739_v1120150715073914_92525858.mp4?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=L%2BHQp%2Bbcu7DXdyWwS0COwYTU0nE%3D","intro":"","size":0,"progress":100,"type":"mp4"}]}
Lectura Labial; Datos de Video; Escenarios Múltiples
El Conjunto de Datos de Video de Lectura Labial de 1.998 Personas abarca múltiples escenarios, diversos grupos de edad y distintos períodos temporales. En cada segmento de video, los participantes pronuncian secuencias de 8 dígitos arábigos mediante movimientos labiales. El dataset contiene 41.866 segmentos de video, con una duración total de 86 horas, 56 minutos y 1,52 segundos. Este recurso es aplicable en tareas de Detección de Vivacidad y Reconocimiento de Labios.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Escala de datos
1.998 personas, mínimo 14 segmentos de video por individuo, totalizando 41.866 segmentos de video
Distribución por edad
Desde adolescentes hasta ancianos, con predominio de adultos jóvenes y de mediana edad
Entorno de captura
Escenario interior
Diversidad de captura
Múltiples escenarios; distintos períodos temporales; diversos grupos de edad