es

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

103 horas de datos de voz en indonesio_diálogo (móvil)

audio
datos
conjunto datos
conversacional
datos ASR
Indonesio

Conjunto de datos de voz en indonesio: Diálogos mediante dispositivos móviles. Este corpus se ha creado a partir de grabaciones simuladas basadas en unos treinta temas comunes. El conjunto incluye anotaciones como el contenido textual, las marcas de tiempo por frase, la identidad y el género del hablante, entre otros atributos. Fue grabado por 168 hablantes nativos indonesios de diversas regiones y antecedentes culturales, lo que garantiza una alta precisión. Este recurso constituye una base valiosa para la investigación y aplicaciones en reconocimiento de voz y, como ha sido validado por varias empresas de AI, ayuda a que los modelos se desempeñen eficazmente ante la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos, todos los datos cumplen con GDPR, CCPA, PIPL.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Formato
16 kHz, 16 bit, wav sin comprimir, monoaural
Clasificación de contenido
El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos
Condiciones de grabación
Interior relativamente silencioso, sin eco
Equipo de grabación
Teléfonos Android, iPhone
Información sobre la grabadora
Total 168 personas: hombres 82 personas, mujeres 86 personas
País
Indonesia
Código de idioma regional
id-ID
Idioma
Indonesia
Características de etiquetado
Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo
Precisión
Tasa de exactitud por palabra 98%
Ejemplo Ejemplo
  • Audio

    Oh iya, torch itu yang di kayak dibakar pake api.

  • Audio

    Kayaknya sih dikasih apa, kayaknya tuh ada top beberapa topping gitu loh, ada beberapa topping. Kayaknya ada keju juga deh kuliat kemaren, kalo enggak salah.

  • Audio

    Dikasih keju?

  • Audio

    Range harga kemaren itu tu, orang itu bilang murah.

  • Audio

    Kayaknya murah sih. Terus yang ngeja yang lebih menarik lagi refill, jadi itu nasinya bisa ngambil lagi, gitu.

Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Nivel de madurez del proyecto

Fase de exploración inicial (sin especificaciones concretas)
Objetivos definidos, se requiere orientación profesional
Fase de desarrollo u optimización
Expertos en datos y etiquetado con especificaciones claras

Al enviar, acepto la Política de privacidad

2f826119-314a-45d5-888b-68612c66afdc

082383c1-0a67-4909-9b74-85a14232e020