[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, wav sin comprimir, mono"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Los locutores seleccionan varios temas familiares de una lista de temas específica, grabando un diálogo fluido y natural para cada tema"},{"@type":"PropertyValue","name":"Condiciones de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Dispositivos de grabación","value":"Teléfonos Android, iPhone"},{"@type":"PropertyValue","name":"Información del locutor","value":"Aproximadamente 400 personas"},{"@type":"PropertyValue","name":"País","value":"Tanzania"},{"@type":"PropertyValue","name":"Idioma","value":"Suajili"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra 98%"}]
{"id":1692,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"300 horas de datos de conversación natural en suajili recogidos","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, wav sin comprimir, mono"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Los locutores seleccionan varios temas familiares de una lista de temas específica, grabando un diálogo fluido y natural para cada tema"},{"title":"Condiciones de grabación","desc":"Condiciones de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Dispositivos de grabación","desc":"Dispositivos de grabación","content":"Teléfonos Android, iPhone"},{"title":"Información del locutor","desc":"Información del locutor","content":"Aproximadamente 400 personas"},{"title":"País","desc":"País","content":"Tanzania"},{"title":"Idioma","desc":"Idioma","content":"Suajili"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido"},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra 98%"}],"datatag":" Swahili,Tanzania, Dialogue ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00004_003_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=71UTbrBMic7F%2BdDCWxfazTlPPJQ%3D","intro":"Mmmh kwangu mimi napenda wali na njegele, [N]","size":237452,"progress":100,"type":"mp3"},{"name":"00004_003_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=RvNHzPf38BEfn3%2FoEczHRUziwqA%3D","intro":"sababu ni chakula kinachonivutia na kinachoongeza madini mwilini.","size":171212,"progress":100,"type":"mp3"},{"name":"00004_003_phone-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bXiFzyjjEXx1rEIm4TodCG3Yra8%3D","intro":"Ya hayo madini ambayo unazungumzia wewe.","size":116924,"progress":100,"type":"mp3"},{"name":"00004_003_phone-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OQs%2F8Zn9ye%2FISKXFACfiSPbmdzA%3D","intro":"Kwamba yanaongeza inaongeza afya mwilini pamoja na madini.","size":211004,"progress":100,"type":"mp3"},{"name":"00004_003_phone-6.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709115524/00004_003_phone-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=oDSdQMY9yIafWEqTt6RC%2FIYkAMw%3D","intro":"Lakini pia mimi napokula ugali na dagaa, ni chakula ambacho kinanifanya nijisikie nimeshiba. [N]","size":326396,"progress":100,"type":"mp3"}],"officialSummary":"Datos de recolección de conversación natural en suajili, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos de voz en suajili"," datos de voz de Tanzania"," corpus de audio en suajili"," conjunto de datos de transcripción en suajili"," conjunto de datos de voz por smartphone"," conjunto de datos de voz conversacional"," conjunto de datos de idioma africano"," datos ASR multilingües"," corpus de voz de idioma de bajos recursos"," conjunto de datos de voz para IA"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"310 Hours - Swahili(Tanzania) Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
300 horas de datos de conversación natural en suajili recogidos
Conjunto de datos de voz en suajili
datos de voz de Tanzania
corpus de audio en suajili
conjunto de datos de transcripción en suajili
conjunto de datos de voz por smartphone
conjunto de datos de voz conversacional
conjunto de datos de idioma africano
datos ASR multilingües
corpus de voz de idioma de bajos recursos
conjunto de datos de voz para IA
Datos de recolección de conversación natural en suajili, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, wav sin comprimir, mono
Clasificación de contenido
Los locutores seleccionan varios temas familiares de una lista de temas específica, grabando un diálogo fluido y natural para cada tema
Condiciones de grabación
Interior relativamente silencioso, sin eco
Dispositivos de grabación
Teléfonos Android, iPhone
Información del locutor
Aproximadamente 400 personas
País
Tanzania
Idioma
Suajili
Características de la anotación
Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido
Precisión
Precisión de palabra 98%
Ejemplo
Audio
Mmmh kwangu mimi napenda wali na njegele, [N]
Audio
sababu ni chakula kinachonivutia na kinachoongeza madini mwilini.
Audio
Ya hayo madini ambayo unazungumzia wewe.
Audio
Kwamba yanaongeza inaongeza afya mwilini pamoja na madini.
Audio
Lakini pia mimi napokula ugali na dagaa, ni chakula ambacho kinanifanya nijisikie nimeshiba. [N]