es

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

Datasets de LLM

Mejore instantáneamente el rendimiento del modelo de IA con Datasets listos para usar de alta calidad.

Tipo

Todo
29
Pie de imagen
14
Datasets SFT
6
Texto de preentrenamiento
12

250.000 ejercicios de banco de preguntas financieras

Este conjunto de datos se centra en el ámbito financiero, cubriendo preguntas de examen en subdirecciones como productos, mercados, comportamiento, principios, con un volumen total de 250.000 preguntas. De estas, preguntas de opción múltiple y preguntas abiertas representan la mitad cada una, con 125.000 preguntas respectivamente. Los datos se almacenan en formato JSONL, pudiendo proporcionar material abundante para investigación y aprendizaje de conocimientos financieros.
Finanzas preguntas examen selección Pregunta-respuesta

50.000 conjuntos de datos de edición de imágenes

50.000 grupos de datos de edición de imágenes. Los tipos de edición incluyen eliminación de objetivo, adición de objetivo, modificación de objetivo, reemplazo de objetivo. Los objetivos de edición cubren escenarios como personas, animales, productos, plantas, paisajes, etc. En cuanto a anotaciones, según las instrucciones de edición, se realiza recorte y anotación de eliminación/adición/modificación/reemplazo del objetivo que necesita edición en la imagen. Los datos pueden usarse para composición de imágenes, aumento de datos, generación de escenas virtuales y otras tareas.
Edición imagen

1.500.000 ejercicios datos procesamiento análisis estructurado exámenes coreano

Datos estructurados de análisis de preguntas de examen en coreano, volumen total aproximado de 1.500.000 preguntas; cada pregunta contiene campos como tipo de pregunta, enunciado, respuesta, análisis, etc.; las asignaturas incluyen:Primaria:lengua nacional, matemáticas, inglés, estudios sociales, ciencias;Secundaria: lengua nacional, inglés, matemáticas, ciencias, estudios sociales;Bachillerato: lengua nacional, inglés, matemáticas, física, química, biología, historia, geografía;los tipos de preguntas incluyen opción múltiple, completar espacios, verdadero/falso, respuesta abierta, etc.; estos datos pueden utilizarse para tareas de mejora de conocimiento disciplinario en modelos de gran escala.
Preguntas K12 Texto LLM Coreano

32.000.000 ejercicios de datos procesados de análisis estructural de texto de exámenes de ciencias e ingeniería

Datos de procesamiento de análisis estructurado de texto de 32.000.000 de preguntas de examen de ciencias e ingeniería, que contienen asignaturas de ciencias e ingeniería como matemáticas, física, química, biología en primaria, secundaria, preparatoria y universidad. Cada pregunta contiene campos como problema, respuesta, análisis, tipo de pregunta, asignatura, etapa educativa. Estos datos pueden usarse para tareas de mejora de conocimiento disciplinario de modelos grandes.
Preguntas asignaturas ciencias LLM Texto

1.000.000 ejercicios de datos procesados de análisis estructural de texto de exámenes de código en chino

Datos de procesamiento de análisis estructurado de texto de 1.000.000 de preguntas de examen de código en chino, que contienen preguntas de código en múltiples lenguajes como c, c++, python, java, javascript. Cada pregunta contiene campos como problema, respuesta, análisis y lenguaje. Estos datos pueden ayudar al modelo a construir y consolidar habilidades de programación de código, logrando así un mejor desempeño en tareas de programación.
Preguntas código LLM Texto

100.000 entradas de conjunto de datos de texto para ajuste fino de instrucciones con modelos grandes en inglés

Conjunto de datos de texto para ajuste fino de instrucciones con modelos grandes en inglés, recurso de entrenamiento diseñado específicamente para la optimización de modelos de IA, mejora significativamente la capacidad de comprensión y ejecución de instrucciones del modelo, con doble verificación por lingüistas e ingenieros de IA, compatible perfectamente con los requisitos de ajuste fino de modelos preentrenados principales.
Conjunto de datos de ajuste fino para LLM ajuste fino supervisado conjunto de datos SFT datos de ajuste de instrucciones en inglés datos LLM de dominio general ajuste fino de modelos de IA datos de entrenamiento para seguimiento de instrucciones conjunto de datos de ajuste para GPT

25.000 conjuntos de datos de video multietilo de personas

Datos de video multiesilo de 25.000 personas, que contienen videos de múltiples estilos de 25.000 personas en diferentes escenarios. Los tonos de piel cubren blanco/amarillo/marrón/negro, las edades cubren jóvenes/adultos/ancianos. La resolución de video no es inferior a 1.920x1.080, la duración no es inferior a 10 segundos. Este conjunto de datos puede usarse para generación de video con consistencia de personajes, generación de humanos digitales y otras tareas.
Vídeo personas relacionadas Humano digital Generación vídeo

5.937 cuadros y 1.400 imágenes de datos de descripción y anotación de comportamiento humano

1.400 imágenes de datos de descripción y anotación de comportamiento humano recogen múltiples escenarios y múltiples actividades humanas, y se han anotado las personas en las imágenes. Estos datos pueden proporcionar recursos ricos para modelos grandes multimodales. Después de ser verificados por múltiples empresas de IA, estos datos ayudan a que los modelos se desempeñen de manera excelente en aplicaciones del mundo real. Durante el proceso de recolección, almacenamiento y uso de datos, siempre seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando que la privacidad y los derechos legítimos de los usuarios sean mantenidos. Todos los datos cumplen con los requisitos regulatorios como GDPR, CCPA y PIPL.
Conjunto de datos de acciones humanas conjunto de datos de imágenes de actividades humanas imágenes de reconocimiento de acciones conjunto de datos anotado de actividades humanas conjunto de datos de descripción de imágenes humanas conjunto de datos multimodal humano datos de detección de acciones humanas conjunto de datos VLA

1.000.000 de conjuntos de datos de descripción de imágenes en escenarios generales (descripción detallada)

1 millón de grupos de imágenes y descripciones, los tipos de imágenes cubren múltiples categorías como paisajes, animales, flores y árboles, personas, automóviles, deportes, industria y arquitectura, y un subconjunto estético, describiendo la escena general de la imagen, detalles en la escena y las emociones expresadas por la imagen, el idioma de descripción es inglés y chino.
Descripción texto multimodalidad conjunto datos escena general subtítulos inglés subtítulos chino

loading

Personalice sus datos ahora

Por qué Datasets listos para usar

  • Derechos de autor

    Derechos de autor

    Derechos de autor claros y Listo para revisar
  • Seguridad

    Seguridad

    Autorizado adecuadamente Uso seguro
  • Profesional

    Profesional

    Diseñado y producido por expertos en datos de IA
  • Diversidad

    Diversidad

    Recogido de una variedad de escenas reales
  • Efectivo en costos

    Efectivo en costos

    Más rentable que los datos personalizados
  • Eficiencia

    Eficiencia

    Listo para llevar entrega en segundos
a5df12b6-7e66-44ae-b30e-21db3b7ff9eb