Datasets de comprensión del lenguaje natural， los mejores Datasets de CLN

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

hogar > Todos los Datasets de categorías > Datasets de CLN

Tipo

Todo

Intención comprensión

Corpus paralelo

47.811 oraciones datos anotación intención oraciones únicas escenarios interactivos

Datos de anotación de intención de oraciones únicas en escenarios interactivos, con un tamaño de datos de 47.811 oraciones, anotadas por clase de intención, incluyendo información de ranuras (slots) y valores de ranuras; Los dominios de intención incluyen música, clima, fecha, agenda, dispositivos para el hogar, etc.; Estos datos pueden usarse para investigación en áreas relacionadas como el reconocimiento de intenciones.

Datos anotación intención datos anotación intención interactiva reconocimiento intención datos reconocimiento intención PNL datos NLU

80.120.000 pares de datos de corpus paralelos chino-inglés

Corpus paralelo de traducción mutua chino-inglés, almacenado en documentos TXT que cubren dominios como turismo, medicina, vida cotidiana y series de televisión. Los datos han sido limpiados, desensibilizados y verificados mediante control de calidad, pudiendo servir como corpus base para análisis de datos textuales en campos como traducción automática.

Datos de Corpus Paralelo Chino-Inglés Alineación Chino-Inglés Corpus

1.990.000 grupos de datos de corpus paralelo chino-checo

Los datos de corpus paralelo chino-checo incluyen 1,99 millones de grupos de corpus paralelos traducidos mutuamente en chino y checo, el formato de almacenamiento de datos es documento txt. Se ha realizado limpieza de datos, desensibilización y control de calidad, puede servir como corpus base para el análisis de datos de tipo texto, utilizado en campos como la traducción automática.

Datos Corpus Paralelo Chino-Checo Corpus Alineado Datos corpus paralelo Datos corpus alineado

850.000 grupos datos corpus paralelo inglés-japonés

850.000 grupos de corpus paralelo inglés-japonés, formato de almacenamiento: documentos txt, cubre turismo, medicina, vida diaria, noticias, etc. Limpieza de datos, desidentificación y control de calidad realizados, puede servir como corpus base para análisis de datos textuales, aplicable en traducción automática, etc.

Datos Corpus Paralelo Inglés-Japonés Corpus Paralelo Inglés-Japonés Datos corpus paralelo Datos corpus alineado

Personalice sus datos ahora

Por qué Datasets listos para usar

Derechos de autor
Derechos de autor claros y Listo para revisar
Seguridad
Autorizado adecuadamente Uso seguro
Profesional
Diseñado y producido por expertos en datos de IA
Diversidad
Recogido de una variedad de escenas reales
Efectivo en costos
Más rentable que los datos personalizados
Eficiencia
Listo para llevar entrega en segundos

Suscríbete a nuestro boletín

Sé el primero en recibir los últimos lanzamientos de productos, soluciones de datos y noticias empresariales de Nexdata.

Datasets listos para usar: Todos los Datasets de categorías; Datasets de LLM; Datasets de visión artificial; Datasets de reconocimiento de voz; Datasets de síntesis de voz; Datasets de OCR; Diccionario de pronunciación; Datasets de CLN

Servicio de Datos: Datos de nube de puntos 3D; Datos de Street View; Datos OCR; Datos de reconocimiento de comportamiento; Datos de reconocimiento de identidad; Datos de reconocimiento de voz; Datos de síntesis de voz; Datos multimodales

Industrias: IA encarnada; IA generativa; Vehículos autónomos; RA/RV; IA conversacional; Hogar inteligente; Comercio minorista; Sanidad inteligente

Empresa: Sobre nosotros; Noticias; Socios; Calidad y seguridad; Eventos
Enlaces: OPENMPD; DataPlus; Datarade

Plataforma: Plataforma
Competencia: Competencia
Recursos: Datasets patrocinados

Mejore su IA con mejores datos

+1(626)594-5598

[email protected]

Mapa del sitio Términos y condiciones

Utilizamos cookies para mejorar tu experiencia de navegación, mostrarte anuncios o contenido personalizados y analizar nuestro tráfico. Al hacer clic en "Aceptar todo", aceptas nuestro uso de cookies.

7484ea28-67d0-40bb-934e-7474bbe9a3f4

Datasets de CLN

Tipo

5.310.000 grupos datos corpus paralelo chino-alemán

84.516 oraciones datos anotación intención oraciones únicas inglés interactivo

1.080.000 grupos datos corpus paralelo inglés-ruso

1.340.000 grupos de datos corpus paralelo inglés-coreano

380.000 registros de datos de corpus paralelo japonés-inglés