[{"@type":"PropertyValue","name":"Formato","value":"1) Matriz de 16 micrófonos de campo lejano: 48 kHz, 16 bits, wav, 16 canales; 2) Matriz de 8 micrófonos de campo lejano: 48 kHz, 16 bits, wav, 8 canales; 3) Micrófono de alta fidelidad de campo lejano: 48 kHz, 16 bits, wav, mono; 4) Móvil de campo cercano: 16 kHz, 16 bits, wav, mono"},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Cuatro salas de reuniones de diferentes áreas, cada área incluye tres habitaciones diferentes"},{"@type":"PropertyValue","name":"Contenido de la grabación","value":"Conversaciones de reunión simulando escenarios reales de reuniones"},{"@type":"PropertyValue","name":"Equipos","value":"Matriz de 16 micrófonos, matriz de 8 micrófonos, micrófonos de alta fidelidad, teléfonos móviles"},{"@type":"PropertyValue","name":"Idioma","value":"Mandarín"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Anotación de texto, anotación de identidad del hablante, anotación de género, anotación de ubicación"},{"@type":"PropertyValue","name":"Escenarios de aplicación","value":"Reconocimiento de voz; reconocimiento de voz del hablante"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de oración no inferior al 97%"}]
{"id":1203,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"223","type2str":null,"dataname":"672 horas de datos de voz de reuniones multipersona recogidos multicanal","datazy":[{"title":"Formato","desc":"Formato","content":"1) Matriz de 16 micrófonos de campo lejano: 48 kHz, 16 bits, wav, 16 canales; 2) Matriz de 8 micrófonos de campo lejano: 48 kHz, 16 bits, wav, 8 canales; 3) Micrófono de alta fidelidad de campo lejano: 48 kHz, 16 bits, wav, mono; 4) Móvil de campo cercano: 16 kHz, 16 bits, wav, mono"},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Cuatro salas de reuniones de diferentes áreas, cada área incluye tres habitaciones diferentes"},{"title":"Contenido de la grabación","desc":"Contenido de la grabación","content":"Conversaciones de reunión simulando escenarios reales de reuniones"},{"title":"Equipos","desc":"Equipos","content":"Matriz de 16 micrófonos, matriz de 8 micrófonos, micrófonos de alta fidelidad, teléfonos móviles"},{"title":"Idioma","desc":"Idioma","content":"Mandarín"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Anotación de texto, anotación de identidad del hablante, anotación de género, anotación de ubicación"},{"title":"Escenarios de aplicación","desc":"Escenarios de aplicación","content":"Reconocimiento de voz; reconocimiento de voz del hablante"},{"title":"Precisión","desc":"Precisión","content":"Precisión de oración no inferior al 97%"}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"672 horas de datos de voz de reuniones multipersona recogidos multicanal, el contenido cubre escenarios de reuniones de 3 a 6 personas, recogidos en varios entornos de sala de reuniones, reflejando situaciones de interacción en reuniones reales. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad del hablante, género y ubicación, etc., con alta precisión (precisión de oración mayor o igual al 97%), fuerte facilidad de uso, proporcionando recursos de alta calidad para investigación y aplicación relacionados con el reconocimiento de voz y la identificación de voz, y ha sido verificado por múltiples empresas de IA: ayuda a mejorar la robustez de los modelos en escenarios de reuniones complejas. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Reunión"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"672 Hours of Multi-party Conference Multi-channel Recorded Speech Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
672 horas de datos de voz de reuniones multipersona recogidos multicanal
Reunión
672 horas de datos de voz de reuniones multipersona recogidos multicanal, el contenido cubre escenarios de reuniones de 3 a 6 personas, recogidos en varios entornos de sala de reuniones, reflejando situaciones de interacción en reuniones reales. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad del hablante, género y ubicación, etc., con alta precisión (precisión de oración mayor o igual al 97%), fuerte facilidad de uso, proporcionando recursos de alta calidad para investigación y aplicación relacionados con el reconocimiento de voz y la identificación de voz, y ha sido verificado por múltiples empresas de IA: ayuda a mejorar la robustez de los modelos en escenarios de reuniones complejas. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
1) Matriz de 16 micrófonos de campo lejano: 48 kHz, 16 bits, wav, 16 canales; 2) Matriz de 8 micrófonos de campo lejano: 48 kHz, 16 bits, wav, 8 canales; 3) Micrófono de alta fidelidad de campo lejano: 48 kHz, 16 bits, wav, mono; 4) Móvil de campo cercano: 16 kHz, 16 bits, wav, mono
Entorno de grabación
Cuatro salas de reuniones de diferentes áreas, cada área incluye tres habitaciones diferentes
Contenido de la grabación
Conversaciones de reunión simulando escenarios reales de reuniones
Equipos
Matriz de 16 micrófonos, matriz de 8 micrófonos, micrófonos de alta fidelidad, teléfonos móviles
Idioma
Mandarín
Características de la anotación
Anotación de texto, anotación de identidad del hablante, anotación de género, anotación de ubicación
Escenarios de aplicación
Reconocimiento de voz; reconocimiento de voz del hablante