[{"@type":"PropertyValue","name":"Formato","value":"24 kHz, 16 bits, wav sin comprimir, mono"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Los locutores conversan libremente, grabando un archivo por cada locutor"},{"@type":"PropertyValue","name":"Condiciones de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Dispositivos de grabación","value":"Teléfonos Android, iPhone"},{"@type":"PropertyValue","name":"Información del locutor","value":"Aproximadamente 200 personas"},{"@type":"PropertyValue","name":"País","value":"Japón"},{"@type":"PropertyValue","name":"Idioma","value":"Japonés"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de carácter 98% (la información que no es parte del reconocimiento de voz, como etiquetas de ruido, información del hablante, etc., no se incluye en la estadística)"}]
{"id":1703,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Datos de voz de conversación natural en japonés full-duplex recogidos por móvil","datazy":[{"title":"Formato","desc":"Formato","content":"24 kHz, 16 bits, wav sin comprimir, mono"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Los locutores conversan libremente, grabando un archivo por cada locutor"},{"title":"Condiciones de grabación","desc":"Condiciones de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Dispositivos de grabación","desc":"Dispositivos de grabación","content":"Teléfonos Android, iPhone"},{"title":"Información del locutor","desc":"Información del locutor","content":"Aproximadamente 200 personas"},{"title":"País","desc":"País","content":"Japón"},{"title":"Idioma","desc":"Idioma","content":"Japonés"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género"},{"title":"Precisión","desc":"Precisión","content":"Precisión de carácter 98% (la información que no es parte del reconocimiento de voz, como etiquetas de ruido, información del hablante, etc., no se incluye en la estadística)"}],"datatag":"Japanese,Japan,Dialogue,Full-Duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"G00033S0019_O1_9.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_9.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=g4aYYPMbEEGq1o%2FKzMEuayWuSF8%3D","intro":"徳川綱吉で、ですかね、覚えて[OVERLAP/]いま[/OVERLAP]すか。","size":207346,"progress":100,"type":"mp3"},{"name":"G00033S0019_O1_1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TJysfMzWL9uOkWb1wVG%2B3hTkQOY%3D","intro":"なんかすいません、切れちゃってごめんなさい。","size":78680,"progress":100,"type":"mp3"},{"name":"G00033S0019_O2_17.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_17.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=8oNd5jsAJtQd42ajkgUjU%2F9Aah4%3D","intro":"旅行、行った時とかに見たりするんですか?[N]","size":137764,"progress":100,"type":"mp3"},{"name":"G00033S0019_O2_19.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_19.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZSbdBl5mI9p3aoDX9vMG1TVRjQs%3D","intro":"え、なんか印象に残ってるとか良かったお城あったりしますか。","size":203126,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz de conversación natural en japonés full-duplex recogidos por móvil, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas japonesas de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos de voz en japonés"," diálogo espontáneo en japonés"," datos de audio japonés multipista"," datos de entrenamiento ASR para Japón"," audio japonés grabado por smartphone"," corpus conversacional en japonés"," conjunto de datos de voz en japonés"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"205 Hours - Japanese(Japan) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Datos de voz de conversación natural en japonés full-duplex recogidos por móvil
Conjunto de datos de voz en japonés
diálogo espontáneo en japonés
datos de audio japonés multipista
datos de entrenamiento ASR para Japón
audio japonés grabado por smartphone
corpus conversacional en japonés
conjunto de datos de voz en japonés
Datos de voz de conversación natural en japonés full-duplex recogidos por móvil, basados en temas comunes para grabación simulada. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por personas nativas japonesas de diferentes regiones y antecedentes culturales, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
24 kHz, 16 bits, wav sin comprimir, mono
Clasificación de contenido
Los locutores conversan libremente, grabando un archivo por cada locutor
Condiciones de grabación
Interior relativamente silencioso, sin eco
Dispositivos de grabación
Teléfonos Android, iPhone
Información del locutor
Aproximadamente 200 personas
País
Japón
Idioma
Japonés
Características de la anotación
Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género
Precisión
Precisión de carácter 98% (la información que no es parte del reconocimiento de voz, como etiquetas de ruido, información del hablante, etc., no se incluye en la estadística)