[{"@type":"PropertyValue","name":"Formato","value":"16 kHz 16 bit, wav, monoaural"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Categoría diálogo, categoría autopublicación, categoría variedades, etc."},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Bajo nivel de ruido"},{"@type":"PropertyValue","name":"País","value":"India"},{"@type":"PropertyValue","name":"Idioma","value":"Gujarati"},{"@type":"PropertyValue","name":"Precisión","value":"Tasa de precisión de las palabras 92%"},{"@type":"PropertyValue","name":"Características de etiquetado","value":"Marcado del contenido del texto, marcas de tiempo de las frases, identificación del hablante, género, marcado del ruido, marcado de información sensible"}]
{"id":1608,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"1.528 horas de datos de voz en guyaratí de habla coloquial","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz 16 bit, wav, monoaural"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Categoría diálogo, categoría autopublicación, categoría variedades, etc."},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Bajo nivel de ruido"},{"title":"País","desc":"País","content":"India"},{"title":"Idioma","desc":"Idioma","content":"Gujarati"},{"title":"Precisión","desc":"Precisión","content":"Tasa de precisión de las palabras 92%"},{"title":"Características de etiquetado","desc":"Características de etiquetado","content":"Marcado del contenido del texto, marcas de tiempo de las frases, identificación del hablante, género, marcado del ruido, marcado de información sensible"}],"datatag":"Gujarati,India,Casual Conversation,Monologue,Asr","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"001991_130.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/001991_130.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=rIdOoGyR%2BA%2FJ86epW2SRkjOQ2FI%3D","intro":"અને interaction માંથી વાત વાતો માંથી અંદર ઉંદર ચર્ચા કરશે વાતો કરીએ, અને એની અંદરથી તમારું વ્યક્તિત્વ,[N]","size":202444,"progress":100,"type":"mp3"},{"name":"100092_133.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/100092_133.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eb1LmYvy3Rg0cA1NXrSxHk8gCBY%3D","intro":"તમે નવ Instagram આકાઉન ખોલો","size":49836,"progress":100,"type":"mp3"},{"name":"100022_63.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250722171513/100022_63.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ztdRrT7KDZ1k6wYKno9rSsylGNw%3D","intro":"ત્યારે જ હાંકવાનું ચાલુકરીશ.[N]","size":39788,"progress":100,"type":"mp3"},{"name":"100056_24.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250722171513/100056_24.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TT7nq8oetHEIEmGCLKzotKZdUdQ%3D","intro":"નથી.","size":15948,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz coloquiales en guyaratí de India, contenido cubre áreas generales como redes sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos está anotado con contenido de texto, identidad y género del hablante, entre otros atributos, grabado por múltiples indios de diferentes regiones y antecedentes culturales. Alta precisión, fuerte usabilidad, proporciona recursos abundantes para la investigación y aplicaciones relacionadas con el reconocimiento de voz, ayudando a que los modelos demuestren un excelente rendimiento frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL.","dataexampl":null,"datakeyword":["Guyaratí"," India"," Conversación informal"," Monólogo"," ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"675 Hours - Gujatati(India) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
1.528 horas de datos de voz en guyaratí de habla coloquial
Guyaratí
India
Conversación informal
Monólogo
ASR
Datos de voz coloquiales en guyaratí de India, contenido cubre áreas generales como redes sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos está anotado con contenido de texto, identidad y género del hablante, entre otros atributos, grabado por múltiples indios de diferentes regiones y antecedentes culturales. Alta precisión, fuerte usabilidad, proporciona recursos abundantes para la investigación y aplicaciones relacionadas con el reconocimiento de voz, ayudando a que los modelos demuestren un excelente rendimiento frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz 16 bit, wav, monoaural
Clasificación de contenido
Categoría diálogo, categoría autopublicación, categoría variedades, etc.
Entorno de grabación
Bajo nivel de ruido
País
India
Idioma
Gujarati
Precisión
Tasa de precisión de las palabras 92%
Características de etiquetado
Marcado del contenido del texto, marcas de tiempo de las frases, identificación del hablante, género, marcado del ruido, marcado de información sensible
Ejemplo
Audio
અને interaction માંથી વાત વાતો માંથી અંદર ઉંદર ચર્ચા કરશે વાતો કરીએ, અને એની અંદરથી તમારું વ્યક્તિત્વ,[N]