1.998 personas de datos de vídeo lectura labial

Lectura Labial; Datos de Video; Escenarios Múltiples

El Conjunto de Datos de Video de Lectura Labial de 1.998 Personas abarca múltiples escenarios, diversos grupos de edad y distintos períodos temporales. En cada segmento de video, los participantes pronuncian secuencias de 8 dígitos arábigos mediante movimientos labiales. El dataset contiene 41.866 segmentos de video, con una duración total de 86 horas, 56 minutos y 1,52 segundos. Este recurso es aplicable en tareas de Detección de Vivacidad y Reconocimiento de Labios.

Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.

Especificaciones

Escala de datos

1.998 personas, mínimo 14 segmentos de video por individuo, totalizando 41.866 segmentos de video

Distribución por edad

Desde adolescentes hasta ancianos, con predominio de adultos jóvenes y de mediana edad

Entorno de captura

Escenario interior

Diversidad de captura

Múltiples escenarios; distintos períodos temporales; diversos grupos de edad

Equipos de captura

Teléfonos móviles (cámara frontal), resolución 640 * 480 píxeles

Ángulo de captura

Frontal

Formato de datos

El formato de los datos de vídeo es .mp4

Contenido de captura

Videos de lectura labial con pronunciación de 8 dígitos arábigos

Precisión

La exactitud de la anotación de etiquetas para el tiempo de grabación de video y el contenido leído no es inferior al 95%

Dataset recomendado

208 vietnamitas de datos de detección de vida real 2D

208 datos de detección de vitalidad 2D de personas vietnamitas. Los escenarios de recopilación incluyen interiores y exteriores. Los datos cubren hombres y mujeres, la distribución de edad es desde adolescentes hasta ancianos, centrándose principalmente en jóvenes y adultos de mediana edad. La distribución racial es vietnamita. Los datos incluyen múltiples expresiones, múltiples posturas, muestras adversarias, múltiples condiciones de iluminación, múltiples escenarios. Los datos se pueden utilizar para tareas como pago con reconocimiento facial, verificación de identidad remota, desbloqueo facial de teléfonos móviles.

Datos Rostro_vivo & Anti-Spoofing rostro múltiples razas múltiples posturas múltiples expresiones múltiples escenas múltiples muestras anti-spoofing múltiples grupos edad

200 vietnamitas datos detección vida real 3D

Datos de biopsias en 3D de 200 vietnamitas. Los escenarios de recogida incluyen interiores y exteriores. Los datos cubren hombres y mujeres, y la distribución por edad es menor de 18 años, 18~45 años, 46~60 años y más de 60 años . Los dispositivos de adquisición incluyen iPhone X, iPhone XR, iPhone11, iPhone12, iPhone13. La diversidad de datos incluye multiexpresiones, multigestos faciales, muestras de confrontación, múltiples condiciones de iluminación y múltiples escenas.Los datos de detección en vivo 3D de 200 vietnamitas se pueden utilizar para tareas como el reconocimiento facial 3D y la detección en vivo 3D.

Rostro vivo 3D & Anti_Spoofing varias expresiones posturas faciales muestras anti-spoofing múltiples condiciones luz múltiples escenas

419 personas datos detección vida real colorida

Los escenarios de recogida de los datos de la biopsia Dazzle de 419 personas incluyen tanto interiores como exteriores. Los datos abarcan a hombres y mujeres, y la distribución por edades va de jóvenes a mayores, principalmente de mediana edad y jóvenes. La diversidad de datos incluye múltiples dispositivos, múltiples muestras antagónicas, múltiples condiciones de iluminación y múltiples escenarios. Los datos de la vivisección por deslumbramiento de 419 personas pueden utilizarse para la autenticación de identidad por deslumbramiento, la vivisección y otras tareas.

Datos Rostro vivo colorido & Anti-Spoofing varios dispositivos varias muestras anti-spoofing múltiples condiciones luz múltiples escenas

40 personas datos detección vida real 3D&2D

Datos de vivisección 3D y 2D de 40 personas. Las escenas recogidas fueron escenas de interior y escenas de exterior. Los datos cubren hombres y mujeres, y la distribución de edad es de 18-57 años . Los dispositivos de recopilación incluyen teléfonos móviles, cámaras, iPhone X y modelos superiores. La diversidad de datos incluye múltiples dispositivos, múltiples acciones, múltiples gestos de la cara, múltiples muestras de confrontación, múltiples condiciones de iluminación y múltiples escenas. Los datos se pueden utilizar para tareas tales como detección de cuerpo vivo 2D, reconocimiento facial 2D, reconocimiento facial 3D, detección de cuerpo vivo 3D.

Reconocimiento facial 2D reconocimiento facial 3D anti-spoofing iPhone múltiples modelos escenas interiores exteriores múltiples dispositivos múltiples acciones múltiples posturas faciales múltiples anti-spoofing

1.417 personas datos detección vida real 3D

Los datos de la biopsia 3D de 1.417 personas se recogieron tanto en interiores como en exteriores. Los datos abarcan hombres y mujeres, con una distribución de edad de adolescentes a personas mayores, con un predominio de personas jóvenes y de mediana edad . Los dispositivos de recopilación incluyen iPhone X, iPhone XR. La diversidad de datos incluye múltiples expresiones, múltiples posturas faciales, muestras de confrontación, múltiples condiciones de iluminación y múltiples escenas. Los datos de vivisección 3D de 1.417 personas se pueden utilizar para el reconocimiento facial 3D, la vivisección 3D y otras tareas.

Rostro_vivo 3D & Anti_Spoofing varias expresiones posturas faciales muestras anti-spoofing múltiples condiciones luz múltiples escenas

1.056 personas datos detección vida real

Los escenarios de recogida de datos para la biopsia de 1.056 personas incluyeron tanto interiores como exteriores. Los datos abarcan a hombres y mujeres, y la distribución por edades va desde los adolescentes hasta los ancianos, siendo los de mediana edad y los jóvenes los principales. Los datos incluyen muestras multigestuales, multiexpresivas y multiconfrontacionales. Los datos de detección in vivo de 1.056 personas pueden utilizarse para tareas como el pago mediante barrido facial, la verificación remota de la identidad y el desbloqueo de teléfonos móviles mediante barrido facial.

Datos rostro_vivo & Anti-spoofing rostro múltiples razas múltiples posturas múltiples expresiones múltiples escenas múltiples muestras anti-spoofing múltiples grupos edad

1.998 personas de datos de vídeo lectura labial

Lectura Labial; Datos de Video; Escenarios Múltiples

Nivel de madurez del proyecto