[{"@type":"PropertyValue","name":"Formato","value":"48 kHz, 24 bits, wav, mono"},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Estudio de grabación"},{"@type":"PropertyValue","name":"Contenido de la grabación","value":"Se proporciona una lista de temas, los locutores eligen libremente y conversan libremente sobre los temas seleccionados"},{"@type":"PropertyValue","name":"Personal","value":"Total 294 hablantes no profesionales, de los cuales 150 hombres, 144 mujeres"},{"@type":"PropertyValue","name":"Características de la anotación","value":"16 tipos de anotaciones paralingüísticas, anotación de texto, anotación de marcas de tiempo, etiquetas especiales"},{"@type":"PropertyValue","name":"Equipos","value":"Equipos y software de grabación profesional"},{"@type":"PropertyValue","name":"Idioma","value":"Mandarín chino"},{"@type":"PropertyValue","name":"País","value":"China"},{"@type":"PropertyValue","name":"Código de idioma regional","value":"zh-CN"},{"@type":"PropertyValue","name":"Precisión de carácter","value":"99%"}]
{"id":1620,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"219","type2str":null,"dataname":"Biblioteca de síntesis paralingüística de conversación natural multipista en chino con anotación precisa","datazy":[{"title":"Formato","desc":"Formato","content":"48 kHz, 24 bits, wav, mono"},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Estudio de grabación"},{"title":"Contenido de la grabación","desc":"Contenido de la grabación","content":"Se proporciona una lista de temas, los locutores eligen libremente y conversan libremente sobre los temas seleccionados"},{"title":"Personal","desc":"Personal","content":"Total 294 hablantes no profesionales, de los cuales 150 hombres, 144 mujeres"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"16 tipos de anotaciones paralingüísticas, anotación de texto, anotación de marcas de tiempo, etiquetas especiales"},{"title":"Equipos","desc":"Equipos","content":"Equipos y software de grabación profesional"},{"title":"Idioma","desc":"Idioma","content":"Mandarín chino"},{"title":"País","desc":"País","content":"China"},{"title":"Código de idioma regional","desc":"Código de idioma regional","content":"zh-CN"},{"title":"Precisión de carácter","desc":"Precisión de carácter","content":"99%"}],"datatag":"Spontaneous Dialogue,Seperated track,Conversation,48khz,full duplex,Chinese","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0315_1_001_intervals [16].wav","intro":"有的有的,<P>它那种枪战类型的游戏<M/>呢</M>,考的就是肌肉的反应能力和思维的敏捷能力。","size":1119688,"progress":100,"type":"mp3"},{"name":"0315_2_002_intervals [190].wav","intro":"那<D/>你</D>如<D/>果</D>要介绍<P>是比方有朋友找你,你会推荐他去吃这个<M/>吗</M>?","size":849702,"progress":100,"type":"mp3"},{"name":"0310_1_002_intervals [18].wav","intro":"<V>他现在已经透了一些花絮出来了,我看见<R/>抖音抖音</R>上面已经有了。","size":838228,"progress":100,"type":"mp3"}],"officialSummary":"Biblioteca de síntesis paralingüística de conversación natural en chino con anotación precisa, grabada por múltiples hablantes nativos de chino, con estilo de conversación libre. Dado un tema, los hablantes improvisan, en cada segmento de diálogo, el audio de cada persona se almacena en archivos wav individuales separados. Lingüistas profesionales anotaron información como 16 tipos de anotaciones paralingüísticas, anotaciones de texto, marcas de tiempo, etc., cumpliendo precisamente con los requisitos de desarrollo de síntesis de voz.","dataexampl":null,"datakeyword":["Conjunto de datos de voz paralingüística"," corpus de síntesis de voz en mandarín"," conjunto de datos de síntesis de voz en chino"," síntesis de voz de diálogo espontáneo"," conjunto de datos de síntesis de voz anotado"," conjunto de datos de síntesis de voz de diálogo"," conjunto de datos de síntesis de voz multipista"," conjunto de datos paralingüísticos en chino"," conjunto de datos de diálogo espontáneo"," corpus de voz multipista"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Voice Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechSyn","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"203 hours - Mandarin Chinese Multi-Stream Spontaneous Dialogue Paralanguage Annotated Speech Synthesis Corpus","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Biblioteca de síntesis paralingüística de conversación natural multipista en chino con anotación precisa
Conjunto de datos de voz paralingüística
corpus de síntesis de voz en mandarín
conjunto de datos de síntesis de voz en chino
síntesis de voz de diálogo espontáneo
conjunto de datos de síntesis de voz anotado
conjunto de datos de síntesis de voz de diálogo
conjunto de datos de síntesis de voz multipista
conjunto de datos paralingüísticos en chino
conjunto de datos de diálogo espontáneo
corpus de voz multipista
Biblioteca de síntesis paralingüística de conversación natural en chino con anotación precisa, grabada por múltiples hablantes nativos de chino, con estilo de conversación libre. Dado un tema, los hablantes improvisan, en cada segmento de diálogo, el audio de cada persona se almacena en archivos wav individuales separados. Lingüistas profesionales anotaron información como 16 tipos de anotaciones paralingüísticas, anotaciones de texto, marcas de tiempo, etc., cumpliendo precisamente con los requisitos de desarrollo de síntesis de voz.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
48 kHz, 24 bits, wav, mono
Entorno de grabación
Estudio de grabación
Contenido de la grabación
Se proporciona una lista de temas, los locutores eligen libremente y conversan libremente sobre los temas seleccionados
Personal
Total 294 hablantes no profesionales, de los cuales 150 hombres, 144 mujeres
Características de la anotación
16 tipos de anotaciones paralingüísticas, anotación de texto, anotación de marcas de tiempo, etiquetas especiales