[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, wav, mono."},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Diálogo, medios de comunicación personal, programas de variedades, etc."},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Bajo ruido."},{"@type":"PropertyValue","name":"País","value":"México, etc."},{"@type":"PropertyValue","name":"Código de idioma regional","value":"es-MX, etc."},{"@type":"PropertyValue","name":"Idioma","value":"Español mexicano, etc."},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido."},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra 98% (las anotaciones que no son de transcripción de texto, como etiquetas, identificación de género, identificación del hablante, acento, temas, etc., no se incluyen en el cálculo de precisión)."}]
{"id":1715,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Datos de voz coloquial en español mexicano","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, wav, mono."},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Diálogo, medios de comunicación personal, programas de variedades, etc."},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Bajo ruido."},{"title":"País","desc":"País","content":"México, etc."},{"title":"Código de idioma regional","desc":"Código de idioma regional","content":"es-MX, etc."},{"title":"Idioma","desc":"Idioma","content":"Español mexicano, etc."},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido."},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra 98% (las anotaciones que no son de transcripción de texto, como etiquetas, identificación de género, identificación del hablante, acento, temas, etc., no se incluyen en el cálculo de precisión)."}],"datatag":"Mexico,Spanish,Casual Conversation,ASR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"500002_3.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/500002_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=xsgkBFGV%2BmETZBkJXHvI4rdqOIM%3D","intro":"Pero aquí estamos d-, de vuelta y más emocionados que nunca de sacar este nuevo episodio. Farid, ¿cómo estás, güey?","size":176524,"progress":100,"type":"mp3"},{"name":"500115_3.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/500115_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=v%2BcrMVFH2wwM8SijFNXxF2Uy%2BmI%3D","intro":"pero en general prácticamente todos los antipsicóticos tienen este riesgo, así es que siempre hay que tener esa precaución.","size":199124,"progress":100,"type":"mp3"},{"name":"500172_3.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/500172_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=So0mQjw%2Fd1xpP5ghFOtKp755kKo%3D","intro":"que telescopio me compro, que telescopio me recomiendan, cual es la mejor marca [N]","size":119276,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz coloquial en español mexicano, con contenido que cubre áreas generales como diálogos, medios sociales, programas de variedades, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["México"," Español"," Conversación Casual"," ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"794 Hours - Spanish(Mexico) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Datos de voz coloquial en español mexicano, con contenido que cubre áreas generales como diálogos, medios sociales, programas de variedades, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, wav, mono.
Clasificación de contenido
Diálogo, medios de comunicación personal, programas de variedades, etc.
Entorno de grabación
Bajo ruido.
País
México, etc.
Código de idioma regional
es-MX, etc.
Idioma
Español mexicano, etc.
Características de la anotación
Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido.
Precisión
Precisión de palabra 98% (las anotaciones que no son de transcripción de texto, como etiquetas, identificación de género, identificación del hablante, acento, temas, etc., no se incluyen en el cálculo de precisión).
Ejemplo
Audio
Pero aquí estamos d-, de vuelta y más emocionados que nunca de sacar este nuevo episodio. Farid, ¿cómo estás, güey?
Audio
pero en general prácticamente todos los antipsicóticos tienen este riesgo, así es que siempre hay que tener esa precaución.
Audio
que telescopio me compro, que telescopio me recomiendan, cual es la mejor marca [N]