en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

300 horas de datos de conversación natural en suajili recogidos

Conjunto de datos de voz en suajili
datos de voz de Tanzania
corpus de audio en suajili
conjunto de datos de transcripción en suajili
conjunto de datos de voz por smartphone
conjunto de datos de voz conversacional
conjunto de datos de idioma africano
datos ASR multilingües
corpus de voz de idioma de bajos recursos
conjunto de datos de voz para IA

Datos de recolección de conversación natural en suajili, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Formato
16 kHz, 16 bits, wav sin comprimir, mono
Clasificación de contenido
Los locutores seleccionan varios temas familiares de una lista de temas específica, grabando un diálogo fluido y natural para cada tema
Condiciones de grabación
Interior relativamente silencioso, sin eco
Dispositivos de grabación
Teléfonos Android, iPhone
Información del locutor
Aproximadamente 400 personas
País
Tanzania
Idioma
Suajili
Características de la anotación
Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido
Precisión
Precisión de palabra 98%
Ejemplo Ejemplo
  • Audio

    Mmmh kwangu mimi napenda wali na njegele, [N]

  • Audio

    sababu ni chakula kinachonivutia na kinachoongeza madini mwilini.

  • Audio

    Ya hayo madini ambayo unazungumzia wewe.

  • Audio

    Kwamba yanaongeza inaongeza afya mwilini pamoja na madini.

  • Audio

    Lakini pia mimi napokula ugali na dagaa, ni chakula ambacho kinanifanya nijisikie nimeshiba. [N]

Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

46ff8044-6ec0-4871-9467-c584ad272056

ff3ede12-e491-45da-9205-6b86e5be3f85