en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

Datasets de CLN

Mejore instantáneamente el rendimiento del modelo de IA con Datasets listos para usar de alta calidad.

Tipo

Todo
34
Identificación de entidad
4
Texto de diálogo
1
Intención comprensión
1
Otros
2
Corpus paralelo
23

5.310.000 grupos datos corpus paralelo chino-alemán

5,14 millones de grupos de corpus paralelo chino-alemán, formato de almacenamiento: documentos txt, cubre turismo, medicina, vida diaria, noticias, etc. Limpieza de datos, desidentificación y control de calidad realizados, puede servir como corpus base para análisis de datos textuales, aplicable en traducción automática, etc.
Datos Corpus Paralelo Chino-Alemán Corpus Paralelo Chino-Alemán Datos corpus paralelo Datos corpus alineado

84.516 oraciones datos anotación intención oraciones únicas inglés interactivo

Datos de reconocimiento de intención en inglés tienen un tamaño total de 84.516 oraciones, anotación de tipo intención, contiene información de slots y valores de slots; dominios de intención incluyen música, clima, fecha, agenda, dispositivos domésticos, etc.; pueden usarse para investigación en reconocimiento de intención y campos relacionados.
datos anotación intención inglés datos anotación intención interactiva reconocimiento intención datos reconocimiento intención NLP datos NLU

1.080.000 grupos datos corpus paralelo inglés-ruso

Datos de corpus paralelo inglés-ruso totalizan 1.080.000 de grupos, excluyen vocabulario sensible como política, pornografía, información personal; pueden servir como corpus base para análisis de datos textuales, aplicable en traducción automática, etc.
Datos corpus paralelo inglés-ruso Recolección corpus inglés-ruso Corpus paralelo inglés-ruso Datos corpus paralelo Datos corpus alineado

1.340.000 grupos de datos corpus paralelo inglés-coreano

Datos de corpus paralelo inglés-coreano con un total de 1.34 millones de pares; se excluyeron términos sensibles como política, pornografía e información personal. Puede utilizarse como corpus base para análisis de datos textuales en campos como traducción automática.
Datos de corpus paralelo inglés-coreano Recolección de corpus inglés-coreano Corpus alineado Datos de corpus paralelo Datos de corpus alineado

380.000 registros de datos de corpus paralelo japonés-inglés

Corpus paralelo japonés-inglés con un total de 380.000 pares; se excluyeron vocabulario sensible como política, pornografía e información personal. Puede utilizarse como corpus base para análisis de datos textuales en campos como traducción automática.
Datos de corpus paralelo japonés-inglés Recolección de corpus paralelo japonés-inglés Corpus alineado Datos de corpus paralelo Datos de corpus alineado

687.694 oraciones datos anotación intención dominio abierto

687.694 datos anotados de intención en dominio abierto, anotados a partir de textos reales generados en móviles. Cubre escenarios de tareas pendientes, ubicaciones y agendas. Utilizables en comprensión del lenguaje natural.
Datos dominio abierto datos anotación intención anotación datos textuales datos texto SMS datos NLU datos comprensión intención

47.811 oraciones datos anotación intención oraciones únicas escenarios interactivos

Datos de anotación de intención de oraciones únicas en escenarios interactivos, con un tamaño de datos de 47.811 oraciones, anotadas por clase de intención, incluyendo información de ranuras (slots) y valores de ranuras; Los dominios de intención incluyen música, clima, fecha, agenda, dispositivos para el hogar, etc.; Estos datos pueden usarse para investigación en áreas relacionadas como el reconocimiento de intenciones.
Datos anotación intención datos anotación intención interactiva reconocimiento intención datos reconocimiento intención PNL datos NLU

1.990.000 grupos de datos de corpus paralelo chino-checo

Los datos de corpus paralelo chino-checo incluyen 1,99 millones de grupos de corpus paralelos traducidos mutuamente en chino y checo, el formato de almacenamiento de datos es documento txt. Se ha realizado limpieza de datos, desensibilización y control de calidad, puede servir como corpus base para el análisis de datos de tipo texto, utilizado en campos como la traducción automática.
Datos Corpus Paralelo Chino-Checo Corpus Alineado Datos corpus paralelo Datos corpus alineado

10.000.000 registros corpus SMS chino tradicional

Corpus de mensajes SMS en chino tradicional con un total de 10 millones de mensajes, datos reales de SMS coloquiales en tradicional; solo contiene texto de mensajes; el contenido anotado se almacena en formato TXT; los datos pueden utilizarse para tareas como comprensión del lenguaje natural.
Corpus SMS chino tradicional datos SMS chino tradicional recolección SMS chino tradicional datos corpus chino tradicional

loading

Personalice sus datos ahora

Por qué Datasets listos para usar

  • Derechos de autor

    Derechos de autor

    Derechos de autor claros y Listo para revisar
  • Seguridad

    Seguridad

    Autorizado adecuadamente Uso seguro
  • Profesional

    Profesional

    Diseñado y producido por expertos en datos de IA
  • Diversidad

    Diversidad

    Recogido de una variedad de escenas reales
  • Efectivo en costos

    Efectivo en costos

    Más rentable que los datos personalizados
  • Eficiencia

    Eficiencia

    Listo para llevar entrega en segundos
b052c1af-d4e9-49b3-aaae-ad1e48e962c6