[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bit, wav sin comprimir, monoaural"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos"},{"@type":"PropertyValue","name":"Condiciones de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Equipo de grabación","value":"Teléfonos Android, iPhone"},{"@type":"PropertyValue","name":"Información sobre la grabadora","value":"Total 168 personas: hombres 82 personas, mujeres 86 personas"},{"@type":"PropertyValue","name":"País","value":"Indonesia"},{"@type":"PropertyValue","name":"Código de idioma regional","value":"id-ID"},{"@type":"PropertyValue","name":"Idioma","value":"Indonesia"},{"@type":"PropertyValue","name":"Características de etiquetado","value":"Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo"},{"@type":"PropertyValue","name":"Precisión","value":"Tasa de exactitud por palabra 98%"}]
{"id":1447,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"103 horas de datos de voz en indonesio_diálogo (móvil)","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bit, wav sin comprimir, monoaural"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos"},{"title":"Condiciones de grabación","desc":"Condiciones de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Equipo de grabación","desc":"Equipo de grabación","content":"Teléfonos Android, iPhone"},{"title":"Información sobre la grabadora","desc":"Información sobre la grabadora","content":"Total 168 personas: hombres 82 personas, mujeres 86 personas"},{"title":"País","desc":"País","content":"Indonesia"},{"title":"Código de idioma regional","desc":"Código de idioma regional","content":"id-ID"},{"title":"Idioma","desc":"Idioma","content":"Indonesia"},{"title":"Características de etiquetado","desc":"Características de etiquetado","content":"Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo"},{"title":"Precisión","desc":"Precisión","content":"Tasa de exactitud por palabra 98%"}],"datatag":"Indonesian,Indonesia,Dialogue,Phone","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=BatCWa2NyAYC6VNOsAIHB0nyIsc%3D","intro":"Oh iya, torch itu yang di kayak dibakar pake api.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Lu34T0D%2FL%2F0Ihp2NHwcuoOy%2BHH8%3D","intro":"Kayaknya sih dikasih apa, kayaknya tuh ada top beberapa topping gitu loh, ada beberapa topping. Kayaknya ada keju juga deh kuliat kemaren, kalo enggak salah.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-4.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-4.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=hR0SI8zYQsXKPJ0tenP755yC%2Bfs%3D","intro":"Dikasih keju?","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-8.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-8.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=yLrX5byXOvAI7Zc4bwkbPiiUwgk%3D","intro":"Range harga kemaren itu tu, orang itu bilang murah.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-10.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY240228001_demo1715248803296/APY240228001_demo/00006_001-10.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=KjItjOdL5aAkr6o9pGUMWEjCp4g%3D","intro":"Kayaknya murah sih. Terus yang ngeja yang lebih menarik lagi refill, jadi itu nasinya bisa ngambil lagi, gitu.","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Conjunto de datos de voz en indonesio: Diálogos mediante dispositivos móviles. Este corpus se ha creado a partir de grabaciones simuladas basadas en unos treinta temas comunes. El conjunto incluye anotaciones como el contenido textual, las marcas de tiempo por frase, la identidad y el género del hablante, entre otros atributos. Fue grabado por 168 hablantes nativos indonesios de diversas regiones y antecedentes culturales, lo que garantiza una alta precisión. Este recurso constituye una base valiosa para la investigación y aplicaciones en reconocimiento de voz y, como ha sido validado por varias empresas de AI, ayuda a que los modelos se desempeñen eficazmente ante la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos, todos los datos cumplen con GDPR, CCPA, PIPL.","dataexampl":null,"datakeyword":["audio"," datos"," conjunto datos"," conversacional"," datos ASR"," Indonesio"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"747 Hours - Indonesian(Indonesia) Spontaneous Dialogue Smartphone Speech Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
103 horas de datos de voz en indonesio_diálogo (móvil)
audio
datos
conjunto datos
conversacional
datos ASR
Indonesio
Conjunto de datos de voz en indonesio: Diálogos mediante dispositivos móviles. Este corpus se ha creado a partir de grabaciones simuladas basadas en unos treinta temas comunes. El conjunto incluye anotaciones como el contenido textual, las marcas de tiempo por frase, la identidad y el género del hablante, entre otros atributos. Fue grabado por 168 hablantes nativos indonesios de diversas regiones y antecedentes culturales, lo que garantiza una alta precisión. Este recurso constituye una base valiosa para la investigación y aplicaciones en reconocimiento de voz y, como ha sido validado por varias empresas de AI, ayuda a que los modelos se desempeñen eficazmente ante la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos, todos los datos cumplen con GDPR, CCPA, PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bit, wav sin comprimir, monoaural
Clasificación de contenido
El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos
Condiciones de grabación
Interior relativamente silencioso, sin eco
Equipo de grabación
Teléfonos Android, iPhone
Información sobre la grabadora
Total 168 personas: hombres 82 personas, mujeres 86 personas
País
Indonesia
Código de idioma regional
id-ID
Idioma
Indonesia
Características de etiquetado
Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo
Precisión
Tasa de exactitud por palabra 98%
Ejemplo
Audio
Oh iya, torch itu yang di kayak dibakar pake api.
Audio
Kayaknya sih dikasih apa, kayaknya tuh ada top beberapa topping gitu loh, ada beberapa topping. Kayaknya ada keju juga deh kuliat kemaren, kalo enggak salah.
Audio
Dikasih keju?
Audio
Range harga kemaren itu tu, orang itu bilang murah.
Audio
Kayaknya murah sih. Terus yang ngeja yang lebih menarik lagi refill, jadi itu nasinya bisa ngambil lagi, gitu.