[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, mono"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, el tiempo de inicio y fin de las oraciones válidas, la identificación del hablante, el género"},{"@type":"PropertyValue","name":"Idioma","value":"Árabe emiratí"},{"@type":"PropertyValue","name":"Escenarios de aplicación","value":"Reconocimiento de voz, generación de subtítulos de video, revisión de contenido de video"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra 98%"}]
{"id":1710,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"1503 horas de datos de voz coloquial en árabe emiratí","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, mono"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, el tiempo de inicio y fin de las oraciones válidas, la identificación del hablante, el género"},{"title":"Idioma","desc":"Idioma","content":"Árabe emiratí"},{"title":"Escenarios de aplicación","desc":"Escenarios de aplicación","content":"Reconocimiento de voz, generación de subtítulos de video, revisión de contenido de video"},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra 98%"}],"datatag":"UAE,Conversation ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Datos de voz coloquial en árabe emiratí. Refleja situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por personas nativas emiratíes de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos de voz en árabe emiratí"," conjunto de datos de voz en árabe"," conjunto de datos conversacional en árabe"," corpus de voz en árabe"," datos de voz monólogo en árabe"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1,503 Hours - Arabic(UAE) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
1503 horas de datos de voz coloquial en árabe emiratí
Conjunto de datos de voz en árabe emiratí
conjunto de datos de voz en árabe
conjunto de datos conversacional en árabe
corpus de voz en árabe
datos de voz monólogo en árabe
Datos de voz coloquial en árabe emiratí. Refleja situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por personas nativas emiratíes de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, mono
Características de la anotación
Se anota el contenido del texto, el tiempo de inicio y fin de las oraciones válidas, la identificación del hablante, el género
Idioma
Árabe emiratí
Escenarios de aplicación
Reconocimiento de voz, generación de subtítulos de video, revisión de contenido de video