en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

155 horas datos vídeo sincronización labial_Multimodal

Lenguaje labial
Multimodal
Mandarín
Lectura
Teléfono móvil
Cámara vídeo

249 personas grabando voz + video de labios sincronizado, grabación multi-dispositivo con alineación precisa mediante señales de pulso. Verificado por múltiples empresas de AI: ayuda a que los modelos muestren un rendimiento sobresaliente al enfrentar la diversidad del mundo real. Cumplimos estrictamente con regulaciones de protección de datos y privacidad, garantizando la protección de los derechos e intereses legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL. Utilizable en investigación multimodal voz-imagen.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Formato
Vídeo en formato mp4. 1.280*720; audio en formato wav, 16kHz 16bit monoaural
Entorno de grabación
Simulación silenciosa en interiores de situaciones de conducción diurna al aire libre en una habitación soleada con ventanas; relación señal/ruido 15~20dB
Escena de grabación
Dividido en diferentes escenas grandes y subescenas según la intensidad de la luz
Contenido de la grabación
Instrucciones breves; frases habladas
Grabadora
249 chinos; 125 hombres, 124 mujeres
Equipo de grabación
Cámara, micrófono Hi-Fi, tarjeta de sonido
Ángulo de grabación
Graba simultáneamente vídeo (con audio y vídeo) desde 6 ángulos de la cara frontal, una cara lateral, vista superior, vista superior de la cara lateral, vista superior de la cara lateral y vista superior de la cara lateral, así como audio (sin vídeo) desde 2 distancias: extremo cercano y extremo lejano.
Idioma
Mandarín
Escenarios de aplicación
Reconocimiento labial
Precisión
Tasa de exactitud por frase 95%
Ejemplo Ejemplo
Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

72f3af64-f685-4e28-b826-6187ff6cd69f

affc90d5-b046-4294-b7a9-119deab668d6