en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

534 horas de datos de voz en mandarín con acento taiwanés de diálogo natural recopilados por móvil

Mandarín acentuado
Taiwanés
Diálogo espontáneo

534 horas de datos de voz de conversación natural en mandarín con acento taiwanés recopilados con móvil, grabación simulada basada en más de 30 temas comunes. Este conjunto de datos está anotado con contenido de texto, marca de tiempo de oraciones, identidad del hablante, género y otros atributos, grabados por personas de la región de Taiwán, alta precisión, proporcionan recursos ricos para investigación y aplicaciones relacionadas con reconocimiento de voz, validados por múltiples empresas de AI: ayuda a que los modelos se desempeñen bien frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recopilación, almacenamiento y uso de datos, todos los datos cumplen con GDPR, CCPA, PIPL.

Paid Datasets
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
EspecificacionesEspecificaciones
Formato
16 kHz, 16 bit, wav sin comprimir, monoaural
Entorno de grabación
Interior relativamente silencioso, sin eco
Contenido de grabación
Dada una lista de temas, el grabador selecciona una serie de temas familiares para garantizar un flujo natural del diálogo, desarrolla un diálogo en torno a cada tema y lo graba.
Personal
Un total de 480 personas de Taiwán, con una proporción equilibrada de hombres y mujeres
Características de etiquetado
Interceptar frases válidas para etiquetarlas; los resultados del etiquetado incluyen los puntos inicial y final de las frases válidas, la identificación del hablante y el contenido del texto; etiquetado del ruido.
País
China
Idioma
Mandarín
Escenarios de aplicación
Reconocimiento de voz; reconocimiento de huellas vocales
Precisión
Tasa de exactitud por frase 95%
Ejemplo Ejemplo
Recommended DatasetsDataset recomendado
Indíquenos sus necesidades especiales

Al enviar, acepto la Política de privacidad

02fc7ec8-a91f-454f-8bfa-edfcd4a99bf0

0791de4c-6c43-449f-8516-0ed877652f8d