[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, wav, mono"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Diálogo basado en guiones, o lectura alterna de artículos por dos personas."},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Ambiente interior silencioso"},{"@type":"PropertyValue","name":"Idioma","value":"Gujarati"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra en el texto anotado 95% (las etiquetas de ruido, género, identificación del hablante no se incluyen en el cálculo de precisión)."},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, identificación del hablante, género, ruido."}]
{"id":1824,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Datos de voz de diálogo guionizado en gujarati","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, wav, mono"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Diálogo basado en guiones, o lectura alterna de artículos por dos personas."},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Ambiente interior silencioso"},{"title":"Idioma","desc":"Idioma","content":"Gujarati"},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra en el texto anotado 95% (las etiquetas de ruido, género, identificación del hablante no se incluyen en el cálculo de precisión)."},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, identificación del hablante, género, ruido."}],"datatag":"Gujarati,India,Scripted dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"G00011T22P00001_001_B.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_001_B.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=BVeMdRAP5RsEK8xzqHp54HbEQDA%3D","intro":"નમસ્તે ગીતાબેન, કેમ છો?","size":66482,"progress":100,"type":"mp3"},{"name":"G00011T22P00001_002_A.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_002_A.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=YmlaHSHOff9l6Qlu9a24NjsQ7NE%3D","intro":"નમસ્તે રમેશભાઈ, મજામાં છું. તમે કેમ છો?","size":113960,"progress":100,"type":"mp3"},{"name":"G00011T22P00001_003_B.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_003_B.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NddAvsWI8rWxewaJxuuMRwhfXN0%3D","intro":"હું પણ મજામાં. આજે વાતાવરણ કેટલું સરસ છે, નહીં?","size":105690,"progress":100,"type":"mp3"},{"name":"G00011T22P00001_004_A.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/G00011T22P00001_004_A.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=rs3Pz4itukZjNQAyDRAilbtl6Gs%3D","intro":"હા, ખરેખર! સવારથી જ થોડી ઠંડક લાગે છે.","size":114104,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz de diálogo guionizado en gujarati, basados en guiones dados para simular diálogos y grabaciones, cubriendo múltiples dominios con contenido rico. Este conjunto de datos anota múltiples atributos como el contenido de texto, etc., con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos de audio en gujarati"," conjunto de datos ASR en gujarati"," conjunto de datos de voz en gujarati"," conjunto de datos TTS en gujarati"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1300 Hours - Gujatati(India) Scripted dialogue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Datos de voz de diálogo guionizado en gujarati, basados en guiones dados para simular diálogos y grabaciones, cubriendo múltiples dominios con contenido rico. Este conjunto de datos anota múltiples atributos como el contenido de texto, etc., con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, wav, mono
Clasificación de contenido
Diálogo basado en guiones, o lectura alterna de artículos por dos personas.
Entorno de grabación
Ambiente interior silencioso
Idioma
Gujarati
Precisión
Precisión de palabra en el texto anotado 95% (las etiquetas de ruido, género, identificación del hablante no se incluyen en el cálculo de precisión).
Características de la anotación
Se anota el contenido del texto, identificación del hablante, género, ruido.