en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

Conjunto de datos para competición de voz de diálogo multilingüe Interspeech2025-MLC-SLM

Conjunto de datos de audio de taller
conjunto de datos MLC-SLM
datos de reconocimiento de voz ASR

El contexto del conjunto de datos para la competición de voz de diálogo multilingüe Interspeech2025-MLC-SLM es que Datatang organizó la competición de voz de diálogo multilingüe MLC-SLM en 2025, el conjunto de datos proviene de quince conjuntos de datos de voz de diálogo propios de Datatang. Los datos tienen alta precisión y fuerte facilidad de uso, están diseñados específicamente para superar los cuellos de botella tecnológicos del reconocimiento de voz multilingüe y la comprensión de contexto largo, capturan de manera realista escenarios de interacción complejos como la superposición de hablantes e interrupciones improvisadas, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Formato
16 kHz, 16 bits, wav sin comprimir, mono
Entorno de grabación
Interior relativamente silencioso, sin eco
Contenido de la grabación
Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema
Características de la anotación
Se anota el contenido del texto, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante
Equipos
Teléfonos Android, iPhone
Idioma
Inglés americano, Inglés británico, Inglés filipino, Inglés australiano, Inglés indio, Francés, Alemán, Italiano, Japonés, Coreano, Portugués, Ruso, Español, Tailandés, Vietnamita
Ejemplo Ejemplo
  • Audio

    one direction is the first thing like in the mind

  • Audio

    Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.

  • Audio

    D'accord très bien l'autre, je vais l'effacer alors.

  • Audio

    조금 이제 날씨도 더워지는데 덜 답답하구

  • Audio

    이천치십 년이랑 이천이십일 년 진짜 학교 못 간게

Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

f6a8390c-75dc-4883-ae43-c2c78a04db0a

46708faa-c744-4e61-9fcc-6e27fb49a829