en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

103 horas de datos de voz en indonesio_diálogo (móvil)

audio
datos
conjunto datos
conversacional
datos ASR
Indonesio

Conjunto de datos de voz en indonesio: Diálogos mediante dispositivos móviles. Este corpus se ha creado a partir de grabaciones simuladas basadas en unos treinta temas comunes. El conjunto incluye anotaciones como el contenido textual, las marcas de tiempo por frase, la identidad y el género del hablante, entre otros atributos. Fue grabado por 168 hablantes nativos indonesios de diversas regiones y antecedentes culturales, lo que garantiza una alta precisión. Este recurso constituye una base valiosa para la investigación y aplicaciones en reconocimiento de voz y, como ha sido validado por varias empresas de AI, ayuda a que los modelos se desempeñen eficazmente ante la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos, todos los datos cumplen con GDPR, CCPA, PIPL.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Formato
16 kHz, 16 bit, wav sin comprimir, monoaural
Clasificación de contenido
El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos
Condiciones de grabación
Interior relativamente silencioso, sin eco
Equipo de grabación
Teléfonos Android, iPhone
Información sobre la grabadora
Total 168 personas: hombres 82 personas, mujeres 86 personas
País
Indonesia
Código de idioma regional
id-ID
Idioma
Indonesia
Características de etiquetado
Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo
Precisión
Tasa de exactitud por palabra 98%
Ejemplo Ejemplo
  • Audio

    Oh iya, torch itu yang di kayak dibakar pake api.

  • Audio

    Kayaknya sih dikasih apa, kayaknya tuh ada top beberapa topping gitu loh, ada beberapa topping. Kayaknya ada keju juga deh kuliat kemaren, kalo enggak salah.

  • Audio

    Dikasih keju?

  • Audio

    Range harga kemaren itu tu, orang itu bilang murah.

  • Audio

    Kayaknya murah sih. Terus yang ngeja yang lebih menarik lagi refill, jadi itu nasinya bisa ngambil lagi, gitu.

Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

8cc35889-b111-4f0d-97c9-d62930740831

7f5dc85c-3527-4767-99e6-2c656bde3488