en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

500 horas de datos de voz de conversación natural en dialecto de Wuhan (con anotación bilingüe) recogidos por móvil

Wuhan
Dialecto
Conversación

Datos de voz en dialecto de Wuhan de conversación (móvil), donde los grabadores conversan libremente y se graban. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por usuarios nativos del dialecto, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Formato
24 kHz, 16 bits, wav sin comprimir, mono
Entorno de grabación
Interior relativamente silencioso, sin eco
Contenido de la grabación
Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema
Personal
Aproximadamente 500 locutores, provenientes de condados y ciudades de la región de Wuhan, proporción equilibrada entre hombres y mujeres, cubriendo múltiples grupos de edad
Características de la anotación
Se anota el contenido del texto, la explicación en mandarín, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante
Equipos
Teléfonos Android, iPhone
Idioma
Dialecto de Wuhan
Precisión
Precisión de carácter 98%; Precisión de anotación en mandarín 90%
Escenarios de aplicación
Reconocimiento de voz, reconocimiento de voz del hablante
Ejemplo Ejemplo
  • Audio

    要是如果说哎反正正咱觉得出去玩啊。[N] 要是如果说哎反正现在觉得出去玩啊。

  • Audio

    开拓眼界确实是,让人蛮心情蛮蛮愉快呀。[N] 开拓眼界确实是,让人很心情很很愉快呀。

  • Audio

    是的你要谈那个旅行的话,正咱的话就蛮提倡周边游。[N] 是的你要谈那个旅行的话,现在的话就很提倡周边游。

  • Audio

    乡村游,是不是啊,一日游两日游是吧,我觉得这还是蛮好。[N] 乡村游,是不是啊,一日游两日游是吧,我觉得这还是很好。

  • Audio

    大家都出去玩哈子,看哈子,看哈子那个呢,你像正咱马上也可以看油菜花了呢。[N] 大家都出去玩一下,看一下,看一下那个呢,你像现在马上也可以看油菜花了呢。

Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

e7720887-c9b5-401d-81b4-5718d021b0aa

93373ad1-8ac2-4b07-a3b5-be3d9cac43f0