[{"@type":"PropertyValue","name":"Formato","value":"8 kHz, 8 bit, u-law/a-law pcm, monoaural"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos"},{"@type":"PropertyValue","name":"Condiciones de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Equipo de grabación","value":"Sistema de grabación telefónica"},{"@type":"PropertyValue","name":"Información sobre la grabadora","value":"Total 270 personas: hombres 150 personas, mujeres 120 personas"},{"@type":"PropertyValue","name":"País","value":"Pakistán"},{"@type":"PropertyValue","name":"Código de idioma regional","value":"ur-PK"},{"@type":"PropertyValue","name":"Idioma","value":"Urdu"},{"@type":"PropertyValue","name":"Características de etiquetado","value":"Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo"},{"@type":"PropertyValue","name":"Precisión","value":"Tasa de exactitud por palabra 95%"}]
{"id":1242,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"196 horas datos voz urdu_Diálogo (teléfono)","datazy":[{"title":"Formato","desc":"Formato","content":"8 kHz, 8 bit, u-law/a-law pcm, monoaural"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos"},{"title":"Condiciones de grabación","desc":"Condiciones de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Equipo de grabación","desc":"Equipo de grabación","content":"Sistema de grabación telefónica"},{"title":"Información sobre la grabadora","desc":"Información sobre la grabadora","content":"Total 270 personas: hombres 150 personas, mujeres 120 personas"},{"title":"País","desc":"País","content":"Pakistán"},{"title":"Código de idioma regional","desc":"Código de idioma regional","content":"ur-PK"},{"title":"Idioma","desc":"Idioma","content":"Urdu"},{"title":"Características de etiquetado","desc":"Características de etiquetado","content":"Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo"},{"title":"Precisión","desc":"Precisión","content":"Tasa de exactitud por palabra 95%"}],"datatag":"Conversational Speech,Telephone,Urdu","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9OFuuaPAmeNan5off2%2F6oj%2BT6%2Bw%3D","intro":"کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=SRkh%2BMPsFh9MiaZbCmASEAV82LA%3D","intro":"اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ve42CpgQON0aVljdvvM9DEJh7%2B4%3D","intro":"ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=4Rr5svFZ%2B0AjTuqo2uuw%2BcbWjmY%3D","intro":"ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=15Ai6ApMMr3pFZ%2FpXohi3SeWm6U%3D","intro":"سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz urdu_diálogo (teléfono), grabación simulada basada en aproximadamente veinte temas comunes. Este conjunto de datos está anotado con atributos como contenido textual, marcas de tiempo oracionales, identidad del hablante, género, etc. Grabado por 270 hablantes nativos de diversas regiones y culturas, con alta precisión. Proporciona recursos valiosos para investigación y aplicaciones de reconocimiento de voz. Verificado por múltiples compañías de AI: Ayuda a que los modelos se desempeñen excepcionalmente ante la diversidad del mundo real. Cumplimos estrictamente con regulaciones de protección de datos y privacidad, garantizando la protección de los derechos e intereses legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos. Todos los datos siguen el GDPR, CCPA, PIPL.","dataexampl":null,"datakeyword":["audio"," datos"," conjunto datos"," conversacional"," datos ASR"," Urdu"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"196 Hours - Urdu Conversational Speech Data by Telephone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Datos de voz urdu_diálogo (teléfono), grabación simulada basada en aproximadamente veinte temas comunes. Este conjunto de datos está anotado con atributos como contenido textual, marcas de tiempo oracionales, identidad del hablante, género, etc. Grabado por 270 hablantes nativos de diversas regiones y culturas, con alta precisión. Proporciona recursos valiosos para investigación y aplicaciones de reconocimiento de voz. Verificado por múltiples compañías de AI: Ayuda a que los modelos se desempeñen excepcionalmente ante la diversidad del mundo real. Cumplimos estrictamente con regulaciones de protección de datos y privacidad, garantizando la protección de los derechos e intereses legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos. Todos los datos siguen el GDPR, CCPA, PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
8 kHz, 8 bit, u-law/a-law pcm, monoaural
Clasificación de contenido
El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos
Condiciones de grabación
Interior relativamente silencioso, sin eco
Equipo de grabación
Sistema de grabación telefónica
Información sobre la grabadora
Total 270 personas: hombres 150 personas, mujeres 120 personas
País
Pakistán
Código de idioma regional
ur-PK
Idioma
Urdu
Características de etiquetado
Marcado del contenido del texto, la hora de la frase, la identificación del hablante, el sexo
Precisión
Tasa de exactitud por palabra 95%
Ejemplo
Audio
کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔
Audio
اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،
Audio
ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،
Audio
ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔
Audio
سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔