[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bit, wav sin comprimir, monoaural"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos"},{"@type":"PropertyValue","name":"Condiciones de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Equipo de grabación","value":"Teléfonos Android, iPhone"},{"@type":"PropertyValue","name":"Información sobre la grabadora","value":"Total 338 personas: hombres 152 personas, mujeres 186 personas"},{"@type":"PropertyValue","name":"País","value":"México"},{"@type":"PropertyValue","name":"Código de idioma regional","value":"es-MX"},{"@type":"PropertyValue","name":"Idioma","value":"Español"},{"@type":"PropertyValue","name":"Características de etiquetado","value":"Marcado del contenido del texto, marcas de tiempo de las frases, identificadores del hablante, género, marcadores de ruido"},{"@type":"PropertyValue","name":"Precisión","value":"Tasa de exactitud por palabra 98%"}]
{"id":1303,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"346 horas de datos de voz español mexicano_Diálogo (teléfono móvil)","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bit, wav sin comprimir, monoaural"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos"},{"title":"Condiciones de grabación","desc":"Condiciones de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Equipo de grabación","desc":"Equipo de grabación","content":"Teléfonos Android, iPhone"},{"title":"Información sobre la grabadora","desc":"Información sobre la grabadora","content":"Total 338 personas: hombres 152 personas, mujeres 186 personas"},{"title":"País","desc":"País","content":"México"},{"title":"Código de idioma regional","desc":"Código de idioma regional","content":"es-MX"},{"title":"Idioma","desc":"Idioma","content":"Español"},{"title":"Características de etiquetado","desc":"Características de etiquetado","content":"Marcado del contenido del texto, marcas de tiempo de las frases, identificadores del hablante, género, marcadores de ruido"},{"title":"Precisión","desc":"Precisión","content":"Tasa de exactitud por palabra 98%"}],"datatag":"Spanish,Mexican,Conversation,Phone","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-8.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-8.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2hr81KdneXaMYoenMJPCqZdbRcM%3D","intro":"Doy esta clase cuatro semestres,","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=hWG4Q75JSOueMKKLCDbQdKCjxRQ%3D","intro":"porque doy la asignatura de desarrollo físico y salud.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YfqIGpivorlcL4%2BE6VdmL8LHaVo%3D","intro":"Pues más o menos, qué crees que este es un tema que yo trabajo regularmente con mis alumnos","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-3.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-3.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2F%2BaZH%2BalghvUUJnP0t7AL6K%2FnlQ%3D","intro":"sentirte bien físicamente en movilidad,","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230720001_demo1729159202534/APY230720001_demo/hea_G00005_16k-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Ul9SFZDszg2oDQo9W%2F5Dq2Bi5Cg%3D","intro":"físico del, del cuerpo, o sea,","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz en español mexicano_Diálogo (móvil), basados en aproximadamente treinta temas comunes para grabación simulada. Este conjunto de datos está anotado con contenido de texto, marcas de tiempo de oraciones, identidad del hablante, género y otros atributos, grabado por 338 nativos mexicanos de diferentes regiones y antecedentes culturales. Alta precisión, proporciona recursos abundantes para la investigación y aplicaciones relacionadas con el reconocimiento de voz, verificados por múltiples empresas de AI: ayuda a que los modelos demuestren un excelente rendimiento frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL.","dataexampl":null,"datakeyword":["audio"," datos"," conjunto datos"," conversacional"," datos ASR"," español"," mexicano"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"346 Hours - Mexican Spanish Conversational Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
346 horas de datos de voz español mexicano_Diálogo (teléfono móvil)
audio
datos
conjunto datos
conversacional
datos ASR
español
mexicano
Datos de voz en español mexicano_Diálogo (móvil), basados en aproximadamente treinta temas comunes para grabación simulada. Este conjunto de datos está anotado con contenido de texto, marcas de tiempo de oraciones, identidad del hablante, género y otros atributos, grabado por 338 nativos mexicanos de diferentes regiones y antecedentes culturales. Alta precisión, proporciona recursos abundantes para la investigación y aplicaciones relacionadas con el reconocimiento de voz, verificados por múltiples empresas de AI: ayuda a que los modelos demuestren un excelente rendimiento frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bit, wav sin comprimir, monoaural
Clasificación de contenido
El grabador elige algunos temas conocidos de una lista específica y graba un diálogo fluido y natural sobre cada uno de ellos
Condiciones de grabación
Interior relativamente silencioso, sin eco
Equipo de grabación
Teléfonos Android, iPhone
Información sobre la grabadora
Total 338 personas: hombres 152 personas, mujeres 186 personas
País
México
Código de idioma regional
es-MX
Idioma
Español
Características de etiquetado
Marcado del contenido del texto, marcas de tiempo de las frases, identificadores del hablante, género, marcadores de ruido
Precisión
Tasa de exactitud por palabra 98%
Ejemplo
Audio
Doy esta clase cuatro semestres,
Audio
porque doy la asignatura de desarrollo físico y salud.
Audio
Pues más o menos, qué crees que este es un tema que yo trabajo regularmente con mis alumnos