[{"@type":"PropertyValue","name":"Formato","value":"Micrófono - 48 kHz, 16 bits, wav sin comprimir, mono; Móvil - 24 kHz, 16 bits, wav sin comprimir, mono."},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Interior relativamente silencioso, sin eco."},{"@type":"PropertyValue","name":"Contenido de la grabación","value":"Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema."},{"@type":"PropertyValue","name":"Personal","value":"Aproximadamente 3600 locutores, proporción equilibrada entre hombres y mujeres, cubriendo múltiples grupos de edad."},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, la explicación en mandarín, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante."},{"@type":"PropertyValue","name":"Equipos","value":"Tarjeta de sonido + micrófono de alta fidelidad / teléfono móvil."},{"@type":"PropertyValue","name":"Idioma","value":"Mandarín"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de carácter 99%."},{"@type":"PropertyValue","name":"Escenarios de aplicación","value":"Reconocimiento de voz, reconocimiento de voz del hablante."}]
{"id":1890,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"3000 horas de datos de voz de conversación natural en mandarín full-duplex","datazy":[{"title":"Formato","desc":"Formato","content":"Micrófono - 48 kHz, 16 bits, wav sin comprimir, mono; Móvil - 24 kHz, 16 bits, wav sin comprimir, mono."},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Interior relativamente silencioso, sin eco."},{"title":"Contenido de la grabación","desc":"Contenido de la grabación","content":"Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema."},{"title":"Personal","desc":"Personal","content":"Aproximadamente 3600 locutores, proporción equilibrada entre hombres y mujeres, cubriendo múltiples grupos de edad."},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, la explicación en mandarín, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante."},{"title":"Equipos","desc":"Equipos","content":"Tarjeta de sonido + micrófono de alta fidelidad / teléfono móvil."},{"title":"Idioma","desc":"Idioma","content":"Mandarín"},{"title":"Precisión","desc":"Precisión","content":"Precisión de carácter 99%."},{"title":"Escenarios de aplicación","desc":"Escenarios de aplicación","content":"Reconocimiento de voz, reconocimiento de voz del hablante."}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Datos de voz de conversación natural en mandarín full-duplex, basados en diálogos de temas comunes grabados. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Full-Duplex"," Diálogo"," Mandarín"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"4600 Hours - Mandarin Full-Duplex Spontaneous Dialogue Speech Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
3000 horas de datos de voz de conversación natural en mandarín full-duplex
Full-Duplex
Diálogo
Mandarín
Datos de voz de conversación natural en mandarín full-duplex, basados en diálogos de temas comunes grabados. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
Micrófono - 48 kHz, 16 bits, wav sin comprimir, mono; Móvil - 24 kHz, 16 bits, wav sin comprimir, mono.
Entorno de grabación
Interior relativamente silencioso, sin eco.
Contenido de la grabación
Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema.
Personal
Aproximadamente 3600 locutores, proporción equilibrada entre hombres y mujeres, cubriendo múltiples grupos de edad.
Características de la anotación
Se anota el contenido del texto, la explicación en mandarín, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante.
Equipos
Tarjeta de sonido + micrófono de alta fidelidad / teléfono móvil.
Idioma
Mandarín
Precisión
Precisión de carácter 99%.
Escenarios de aplicación
Reconocimiento de voz, reconocimiento de voz del hablante.