12 horas de corpus de síntesis multi-emocional de voz femenina estilo presentador de entretenimiento chino

Corpus síntesis

TTS

Mandarín

Multi-emocional

Presentador entretenimiento

Biblioteca de síntesis multitemperamental estilo presentador de entretenimiento de 12 horas, grabada por locutores nativos de chino. Datos de siete emociones y partículas modales. Cobertura equilibrada de fonemas en el corpus, participación de fonetistas profesionales en la anotación, satisfaciendo con precisión las necesidades de investigación y desarrollo de la síntesis de voz.

Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.

Dataset recomendado

Biblioteca de síntesis de timbre promedio de narración con alta expresividad en chino de 4 personas

Biblioteca de síntesis de timbre promedio de narración con alta expresividad en chino de 4 personas, recogida por actores de voz profesionales, dado un libro, los hablantes leen en un estilo de narración con alta expresividad.

Alta expresividad Narración TTS Chino

Biblioteca de síntesis de timbre promedio multiestilo y multiemocional de 4 personas

Biblioteca de síntesis de timbre promedio multiestilo y multiemocional de 4 personas, recogida por actores de voz profesionales. Los estilos incluyen 4 tipos: jefa eficiente, príncipe franco, criada ágil y anciana bondadosa; las emociones incluyen desdén, ira, alegría, preocupación, sorpresa, jadeo de miedo, resoplido (desdén), simpatía, risa, actividad mental, seriedad, disgusto, duda y neutral.

Corpus de Síntesis TTS Mandarín Chino Multiestilo Multiemocional

Biblioteca de síntesis de partículas modales multiemocionales y conversación libre en chino

Biblioteca de síntesis de partículas modales multiemocionales y conversación libre en chino, grabada por múltiples actores de voz nativos de chino. Incluye tanto oraciones con partículas modales ricas, que se ajustan a los hábitos de expresión diaria, como datos de conversación libre sobre temas dados, y en cada segmento de diálogo, el audio de cada hablante se almacena de forma independiente en sus propias pistas. Lingüistas profesionales han anotado información como el contenido de texto, etc., satisfaciendo plenamente las necesidades precisas de desarrollo de síntesis de voz.

Datos de voz emocional en chino corpus de voz conversacional en chino conjunto de datos de conversación natural en chino conjunto de datos prosódicos en chino

Biblioteca de síntesis de conversación libre multiemocional en chino de 8 personas

Biblioteca de síntesis de conversación libre multiemocional en chino de 8 personas, grabada por hablantes nativos de chino, con estilo de conversación libre. Dado un tema, los hablantes improvisan, las emociones incluyen principalmente alegría, curiosidad, confusión, consuelo y neutral. Lingüistas profesionales participaron en la anotación, con anotaciones emocionales y paralingüísticas. Cumpliendo precisamente con los requisitos de desarrollo de síntesis de voz con alta naturalidad y rica en emociones.

Conversación natural Lenguaje paralingüístico Multiemocional TTS Chino mezcla chino-inglés

Biblioteca de síntesis paralingüística de conversación natural multipista en chino con anotación precisa

Biblioteca de síntesis paralingüística de conversación natural en chino con anotación precisa, grabada por múltiples hablantes nativos de chino, con estilo de conversación libre. Dado un tema, los hablantes improvisan, en cada segmento de diálogo, el audio de cada persona se almacena en archivos wav individuales separados. Lingüistas profesionales anotaron información como 16 tipos de anotaciones paralingüísticas, anotaciones de texto, marcas de tiempo, etc., cumpliendo precisamente con los requisitos de desarrollo de síntesis de voz.

Conjunto de datos de voz paralingüística corpus de síntesis de voz en mandarín conjunto de datos de síntesis de voz en chino síntesis de voz de diálogo espontáneo conjunto de datos de síntesis de voz anotado conjunto de datos de síntesis de voz de diálogo conjunto de datos de síntesis de voz multipista conjunto de datos paralingüísticos en chino conjunto de datos de diálogo espontáneo corpus de voz multipista

Biblioteca de síntesis paralingüística de conversación natural en chino con anotación precisa

Biblioteca de síntesis paralingüística de conversación natural en chino con anotación precisa, grabada por 370 hablantes nativos de chino, con estilo de conversación libre. Dado un tema, los hablantes improvisan. Lingüistas profesionales han anotado información como 14 tipos de anotaciones paralingüísticas, anotaciones de texto, hablantes, etc., cumpliendo precisamente con los requisitos de desarrollo de síntesis de voz.

Conjunto de datos paralingüísticos en chino conjunto de datos de diálogo espontáneo corpus de voz conversacional en chino corpus de síntesis de voz en mandarín conjunto de datos de síntesis de voz en chino

Biblioteca de síntesis de timbre promedio de 4 personas en cantonés de Hong Kong

Biblioteca de síntesis de timbre promedio de 4 personas en cantonés de Hong Kong, con participación de personas nativas de Hong Kong en la grabación. Los textos de grabación incluyen contenido educativo, de juegos y coloquial general. La cobertura de fonemas del corpus es equilibrada, y lingüistas profesionales participaron en la anotación, cumpliendo precisamente con los requisitos de desarrollo de síntesis de voz.

Conjunto de datos de voz en cantonés corpus de voz en cantonés de Hong Kong conjunto de datos de texto a voz en cantonés conjunto de datos de voz en cantonés para IA grabaciones de voz nativa en cantonés conjunto de datos TTS para cantonés conjunto de datos de voz con acento de Hong Kong

2 bibliotecas de síntesis de timbre promedio en coreano

Este conjunto de datos es una biblioteca de síntesis de voz promedio en coreano de 2 personas, grabada por hablantes nativos de Corea. La pronunciación es auténtica y contiene materiales de uso común tanto en noticias como en lenguaje coloquial. La cobertura de fonemas en los materiales de audio es equilibrada. Los fonólogos profesionales participaron en la anotación para satisfacer con precisión las necesidades de desarrollo de la síntesis de voz.

TTS Coreano Tono promedio

12 horas de corpus de síntesis multi-emocional de voz femenina estilo presentador de entretenimiento chino

Corpus síntesis TTS Mandarín Multi-emocional Presentador entretenimiento

Nivel de madurez del proyecto

Corpus síntesis

TTS

Mandarín

Multi-emocional

Presentador entretenimiento