100.000 pares de conjuntos de datos de texto SFT de seguimiento de instrucciones complejas en dominio general para modelos grandes en chino
100.000 pares de instrucciones prompt complejas en chino, con una longitud de 50 a 400 caracteres, cada prompt contiene no menos de 3 condiciones restrictivas, utilizadas para entrenar y mejorar la capacidad de seguimiento de instrucciones de grandes modelos. Las categorías cubren generación (redacción de noticias, esquemas de entrevistas, creación de textos, revisión de manuscritos, redacciones en chino e inglés, aprendizaje gramatical, informes de investigación, planes de estudio, creación poética, presentación de comida, artículos publicitarios, discursos de ventas, escritura asistida de documentos oficiales, revisión de documentos oficiales, preguntas y respuestas sobre documentos políticos, etc.), reescritura (reformulación de oraciones, corrección de textos, fusión de oraciones, simplificación de textos), resumen (resumen de contenido), extracción (extracción de elementos de eventos, extracción de opiniones, extracción de palabras clave, extracción de posturas, extracción de entidades). Todos los prompts fueron escritos manualmente, satisfacen una cobertura diversificada.
LLM Seguimiento instrucciones SFT