en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

202 personas de datos de video multimodal labial multi-ángulo

Multigonal
multimodal labial
escenas luz natural interior
escenas lámpara fluorescente interior
13 ángulos captura
Mandarín chino
campo general

Datos de video multimodal de labios multiángulo de 202 personas. El entorno de recopilación incluye escenas de luz natural interior y escenas de luz fluorescente interior. El equipo de recopilación fue teléfono móvil. La diversidad de recopilación cubre múltiples escenarios, diferentes edades, 13 ángulos de captura. El idioma es mandarín estándar. El contenido grabado es de dominio general, sin restricciones de contenido. Los datos se pueden utilizar para la investigación de algoritmos de aprendizaje multimodal en el campo de imágenes de voz.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Escala de datos
202 personas, cada persona captura 13 clips de audio-video desde diferentes ángulos + 1 documento txt
Distribución de personal
Distribución racial: raza amarilla (indonesios); distribución de género: 89 hombres, 113 mujeres; rango etario: 165 personas (18-30 años), 32 personas (31-45 años), 5 personas (46-60 años)
Entorno de captura
Escenarios de luz natural interior, escenarios de luz fluorescente interior
Diversidad de los datos
Cubre múltiples escenarios, diferentes edades, diferentes ángulos de captura
Equipos de captura
Móvil, resolución de video 1.920*1.080
Ángulo de captura
Recoge simultáneamente datos de audio y vídeo desde 13 ángulos: cara frontal, 3 ángulos de la cara izquierda, 3 ángulos de la cara derecha, vista superior, vista inferior, vista superior de la cara izquierda, vista superior de la cara derecha, vista inferior de la cara izquierda y vista inferior de la cara derecha.
Contenido de la grabación
Área general, el contenido no está limitado
Idioma
Mandarín estándar, duración de cada segmento de video no inferior a 20 segundos
Formato de datos
Formato de video es .mp4. audio mayor o igual a 16KHz y 16bit, tasa de fotogramas 25-30fps
Precisión
Precisión de caracteres superior a 95%
Ejemplo Ejemplo
  • 202 personas de datos de video multimodal labial multi-ángulo
  • 202 personas de datos de video multimodal labial multi-ángulo
  • 202 personas de datos de video multimodal labial multi-ángulo
Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

32d9656f-dc63-4c7c-9184-ca5c1eefd25a

46160401-ea3e-45f4-8ec2-56b80a3e38a7