[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, wav sin comprimir, mono, canales de hablante separados"},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Contenido de la grabación","value":"Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema"},{"@type":"PropertyValue","name":"Personal","value":"Aproximadamente 800 personas nativas estadounidenses"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se extraen y anotan oraciones simples válidas, los resultados de la anotación incluyen los puntos de tiempo de inicio y fin de las oraciones simples válidas, la identificación del hablante y el contenido del texto; anotación de ruido"},{"@type":"PropertyValue","name":"País","value":"Estados Unidos"},{"@type":"PropertyValue","name":"Idioma","value":"Inglés"},{"@type":"PropertyValue","name":"Escenarios de aplicación","value":"Reconocimiento de voz; reconocimiento de voz del hablante"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra 98%"}]
{"id":1770,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"600 horas de datos de voz de conversación natural en inglés americano multipista recogidos por móvil","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, wav sin comprimir, mono, canales de hablante separados"},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Contenido de la grabación","desc":"Contenido de la grabación","content":"Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema"},{"title":"Personal","desc":"Personal","content":"Aproximadamente 800 personas nativas estadounidenses"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se extraen y anotan oraciones simples válidas, los resultados de la anotación incluyen los puntos de tiempo de inicio y fin de las oraciones simples válidas, la identificación del hablante y el contenido del texto; anotación de ruido"},{"title":"País","desc":"País","content":"Estados Unidos"},{"title":"Idioma","desc":"Idioma","content":"Inglés"},{"title":"Escenarios de aplicación","desc":"Escenarios de aplicación","content":"Reconocimiento de voz; reconocimiento de voz del hablante"},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra 98%"}],"datatag":"full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Datos de voz de conversación natural en inglés americano multipista recogidos por móvil, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas estadounidenses de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos de voz en inglés americano"," conjunto de datos de voz multipista"," conjunto de datos de diálogo full-duplex"," conjunto de datos de voz espontánea"," datos de voz de smartphone"," conjunto de datos de audio multicanal"," datos de entrenamiento de reconocimiento de voz"," conjunto de datos de IA para diálogo"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"170 Hours - American English Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
600 horas de datos de voz de conversación natural en inglés americano multipista recogidos por móvil
Conjunto de datos de voz en inglés americano
conjunto de datos de voz multipista
conjunto de datos de diálogo full-duplex
conjunto de datos de voz espontánea
datos de voz de smartphone
conjunto de datos de audio multicanal
datos de entrenamiento de reconocimiento de voz
conjunto de datos de IA para diálogo
Datos de voz de conversación natural en inglés americano multipista recogidos por móvil, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas estadounidenses de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, wav sin comprimir, mono, canales de hablante separados
Entorno de grabación
Interior relativamente silencioso, sin eco
Contenido de la grabación
Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema
Personal
Aproximadamente 800 personas nativas estadounidenses
Características de la anotación
Se extraen y anotan oraciones simples válidas, los resultados de la anotación incluyen los puntos de tiempo de inicio y fin de las oraciones simples válidas, la identificación del hablante y el contenido del texto; anotación de ruido
País
Estados Unidos
Idioma
Inglés
Escenarios de aplicación
Reconocimiento de voz; reconocimiento de voz del hablante