es

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

hogar > Todos los Datasets de categorías > Datasets de reconocimiento de voz > 155 horas datos vídeo sincronización labial_Multimodal

155 horas datos vídeo sincronización labial_Multimodal

Lenguaje labial

Multimodal

Mandarín

Lectura

Teléfono móvil

Cámara vídeo

249 personas grabando voz + video de labios sincronizado, grabación multi-dispositivo con alineación precisa mediante señales de pulso. Verificado por múltiples empresas de AI: ayuda a que los modelos muestren un rendimiento sobresaliente al enfrentar la diversidad del mundo real. Cumplimos estrictamente con regulaciones de protección de datos y privacidad, garantizando la protección de los derechos e intereses legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL. Utilizable en investigación multimodal voz-imagen.

Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.

Especificaciones

Especificaciones

Formato

Vídeo en formato mp4. 1.280*720; audio en formato wav, 16kHz 16bit monoaural

Entorno de grabación

Simulación silenciosa en interiores de situaciones de conducción diurna al aire libre en una habitación soleada con ventanas; relación señal/ruido 15~20dB

Escena de grabación

Dividido en diferentes escenas grandes y subescenas según la intensidad de la luz

Contenido de la grabación

Instrucciones breves; frases habladas

Grabadora

249 chinos; 125 hombres, 124 mujeres

Equipo de grabación

Cámara, micrófono Hi-Fi, tarjeta de sonido

Ángulo de grabación

Graba simultáneamente vídeo (con audio y vídeo) desde 6 ángulos de la cara frontal, una cara lateral, vista superior, vista superior de la cara lateral, vista superior de la cara lateral y vista superior de la cara lateral, así como audio (sin vídeo) desde 2 distancias: extremo cercano y extremo lejano.

Idioma

Mandarín

Escenarios de aplicación

Reconocimiento labial

Precisión

Tasa de exactitud por frase 95%

Ejemplo

Ejemplo

Recommended Datasets

Dataset recomendado

531 horas de datos de ruido vehicular (micrófono + teléfono móvil)

Datos de ruido en escenarios vehiculares (teléfono móvil + micrófono), que graban las condiciones de ruido dentro del vehículo en escenarios de carretera reales. El conjunto de datos cubre múltiples situaciones como diferentes tipos de vehículos, tipos de carreteras, velocidades y estados de apertura/cierre de ventanas; se utilizaron 6 puntos de grabación para registrar situaciones de ruido en diferentes posiciones del vehículo, coincidiendo precisamente con las necesidades de modelado de ruido vehicular.

Micrófono de mano recolecta datos de ruido vehicular recolección de datos de ruido vehicular ruido vehicular datos de ruido vehicular

Indíquenos sus necesidades especiales

Nivel de madurez del proyecto

Fase de exploración inicial (sin especificaciones concretas)

Objetivos definidos, se requiere orientación profesional

Fase de desarrollo u optimización

Expertos en datos y etiquetado con especificaciones claras

Nombre completo *

Teléfono de contacto*

Nombre de la empresa *

Correo electrónico de la empresa *

Requisitos de datos *

Al enviar, acepto la Política de privacidad

Suscríbete a nuestro boletín

Sé el primero en recibir los últimos lanzamientos de productos, soluciones de datos y noticias empresariales de Nexdata.

Datasets listos para usar: Todos los Datasets de categorías; Datasets de LLM; Datasets de visión artificial; Datasets de reconocimiento de voz; Datasets de síntesis de voz; Datasets de OCR; Diccionario de pronunciación; Datasets de CLN

Servicio de Datos: Datos de nube de puntos 3D; Datos de Street View; Datos OCR; Datos de reconocimiento de comportamiento; Datos de reconocimiento de identidad; Datos de reconocimiento de voz; Datos de síntesis de voz; Datos multimodales

Industrias: IA encarnada; IA generativa; Vehículos autónomos; RA/RV; IA conversacional; Hogar inteligente; Comercio minorista; Sanidad inteligente

Empresa: Sobre nosotros; Noticias; Socios; Calidad y seguridad; Eventos
Enlaces: OPENMPD; DataPlus; Datarade

Plataforma: Plataforma
Competencia: Competencia
Recursos: Datasets patrocinados

Mejore su IA con mejores datos

+1(626)594-5598

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

Copyright © 2023 NEXDATA TECHNOLOGY INC

Mapa del sitio Términos y condiciones

Utilizamos cookies para mejorar tu experiencia de navegación, mostrarte anuncios o contenido personalizados y analizar nuestro tráfico. Al hacer clic en "Aceptar todo", aceptas nuestro uso de cookies.

2083a8dd-fddf-4c9e-b58a-b6332b4a7897

219cfd6d-7039-4081-94d3-024e3760141d