[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, wav sin comprimir, mono"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Los locutores conversan libremente, grabando un archivo por cada locutor"},{"@type":"PropertyValue","name":"Condiciones de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Dispositivos de grabación","value":"Teléfonos Android, iPhone"},{"@type":"PropertyValue","name":"Información del locutor","value":"Aproximadamente 200 personas"},{"@type":"PropertyValue","name":"País","value":"Corea del Sur"},{"@type":"PropertyValue","name":"Idioma","value":"Coreano"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra 98%"}]
{"id":1704,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"200 horas de datos de voz de conversación natural en coreano full-duplex recogidos por móvil","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, wav sin comprimir, mono"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Los locutores conversan libremente, grabando un archivo por cada locutor"},{"title":"Condiciones de grabación","desc":"Condiciones de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Dispositivos de grabación","desc":"Dispositivos de grabación","content":"Teléfonos Android, iPhone"},{"title":"Información del locutor","desc":"Información del locutor","content":"Aproximadamente 200 personas"},{"title":"País","desc":"País","content":"Corea del Sur"},{"title":"Idioma","desc":"Idioma","content":"Coreano"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género"},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra 98%"}],"datatag":"korean,korea,multi-stream,Dialogue ,full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00005_002_1_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NlsqZnHGAvbSvVH1OEhwiTk5wzY%3D","intro":"오케이 오케이.","size":43724,"progress":100,"type":"mp3"},{"name":"00005_002_1_phone-3.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=zkhIVWAhS3uKo2h%2BkJ%2BWwrsCANQ%3D","intro":"여행 여행 요즘 뭐 여행가고 싶은데 없어?","size":223820,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=SE4CYmf6ut37dAFxAogB7QNagKo%3D","intro":"어, 네, 저는 목소리가 엄청 작게 들리는데 원래 이런가?","size":160700,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=wNJqEzby78LskY9GS8bSn0VrYow%3D","intro":"아, 그래요? 이건 어쩔 수 없나 봐요, 끊기진 않은데 저는.","size":167180,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-6.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eNXO3T2Q0J8MypsJ1mFZGhLYv1o%3D","intro":"저번에 여행 갔다 오고 나서 이제","size":153452,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz de conversación natural en coreano full-duplex recogidos por móvil, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas coreanas de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos de voz en coreano"," diálogo espontáneo en coreano"," conjunto de datos de audio multipista"," voz conversacional en coreano"," audio grabado por smartphone"," conjunto de datos de dos hablantes"," conversación coreana del mundo real"," conjunto de datos de voz full-duplex"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"214 Hours - Korean(Korea) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
200 horas de datos de voz de conversación natural en coreano full-duplex recogidos por móvil
Conjunto de datos de voz en coreano
diálogo espontáneo en coreano
conjunto de datos de audio multipista
voz conversacional en coreano
audio grabado por smartphone
conjunto de datos de dos hablantes
conversación coreana del mundo real
conjunto de datos de voz full-duplex
Datos de voz de conversación natural en coreano full-duplex recogidos por móvil, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas coreanas de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, wav sin comprimir, mono
Clasificación de contenido
Los locutores conversan libremente, grabando un archivo por cada locutor
Condiciones de grabación
Interior relativamente silencioso, sin eco
Dispositivos de grabación
Teléfonos Android, iPhone
Información del locutor
Aproximadamente 200 personas
País
Corea del Sur
Idioma
Coreano
Características de la anotación
Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género