300.000.000 de conjuntos de datos de alta calidad de descripción de imágenes

multimodal

imagen

descripción

300 millones de imágenes, cada imagen corresponde a una descripción. Todas son obras de imagen con derechos de autor publicadas por fotógrafos. La gran mayoría tiene descripción en inglés, una parte muy pequeña tiene descripción en chino.

Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.

Especificaciones

Escala de datos

300 millones de imágenes, cada imagen con una descripción. Galería completa (incluye fotos + gráficos vectoriales, etc.) total casi 300 millones. Galería completa utilizable para entrenamiento de IA generativa (fotos editadas/fotos de noticias eliminadas + gráficos vectoriales) total aproximadamente 100 millones.

Formato de datos

Formato de datos de imagen incluye .jpg, .png, .svg; formato de documento descriptivo es .txt

Contenido de los datos

Obras gráficas originales publicadas por autores con sus descripciones

Tipos de imágenes

Fotografías y vectores que cubren una amplia gama de categorías de escenarios

Resolución de imagen

4K y superiores

Lenguaje de descripción

La mayoría de las descripciones están en inglés, muy pocas en chino.

Dataset recomendado

30.000.000 segmentos de datos de video de alta calidad

30.000.000 de segmentos de datos de video de alta calidad. Los tipos de recursos son ricos y diversos, con alta resolución y claridad de imagen, alta fidelidad de reproducción cromática y detalles plenamente mostrados. Todos los materiales se han obtenido a través de canales legales, se etiquetan claramente la propiedad de los derechos de autor y el alcance de la licencia de uso. Todos los materiales proporcionan licencia de uso de nivel comercial y ya han obtenido permiso de uso para investigación científica. La propiedad de la propiedad intelectual es clara y rastreable. Los recursos de imágenes masivos y de alta calidad pueden proporcionar un fuerte apoyo para la investigación en el campo de la visión por computadora, el entrenamiento de algoritmos de reconocimiento de imágenes, la obtención de materiales para diseño creativo y muchos otros escenarios, ayudando a llevar a cabo de manera eficiente el trabajo relacionado.

vídeo 4K

80.000.000 imágenes de datos de imágenes vectoriales

80.000.000 de datos de imágenes vectoriales. Los tipos de recursos son ricos y diversos, con alta fidelidad de reproducción cromática y detalles plenamente mostrados. Todos los materiales se han obtenido a través de canales legales, se etiquetan claramente la propiedad de los derechos de autor y el alcance de la licencia de uso. Todos los materiales proporcionan licencia de uso de nivel comercial y ya han obtenido permiso de uso para investigación científica. La propiedad de la propiedad intelectual es clara y rastreable. Los recursos de imágenes masivos y de alta calidad pueden proporcionar un fuerte apoyo para la investigación en el campo de la visión por computadora, el entrenamiento de algoritmos de reconocimiento de imágenes, la obtención de materiales para diseño creativo y muchos otros escenarios, ayudando a llevar a cabo de manera eficiente el trabajo relacionado.

imagen vector

200.000.000 imágenes de datos de imágenes de alta calidad

Esta base de datos de imágenes contiene 200 millones de datos de imágenes de alta calidad revisados profesionalmente. Los tipos de recursos son ricos y diversos, con alta resolución y claridad de imagen, alta fidelidad de reproducción cromática y detalles plenamente mostrados. Todos los materiales se han obtenido a través de canales legales, se etiquetan claramente la propiedad de los derechos de autor y el alcance de la licencia de uso. Todos los materiales proporcionan licencia de uso de nivel comercial y ya han obtenido permiso de uso para investigación científica. La propiedad de la propiedad intelectual es clara y rastreable. Los recursos de imágenes masivos y de alta calidad pueden proporcionar un fuerte apoyo para la investigación en el campo de la visión por computadora, el entrenamiento de algoritmos de reconocimiento de imágenes, la obtención de materiales para diseño creativo y muchos otros escenarios, ayudando a llevar a cabo de manera eficiente el trabajo relacionado.

imagen 4K

100.000 problemas de razonamiento lógico con modelos grandes

100.000 problemas de datos de recolección de preguntas de razonamiento lógico, que cubren varios tipos de preguntas como razonamiento gráfico, pruebas de coeficiente intelectual IQ, razonamiento de pensamiento lógico, preguntas de visión gráfica, razonamiento de imágenes de enciclopedia de conocimiento, razonamiento detectivesco, etc., y se han transcrito las preguntas, respuestas y análisis. Este conjunto de datos incluye el proceso de cadena de pensamiento, que puede mejorar la capacidad de razonamiento lógico de los modelos grandes. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Lógico Cadena de pensamiento VLM

25.000 conjuntos de datos de video multietilo de personas

Datos de video multiesilo de 25.000 personas, que contienen videos de múltiples estilos de 25.000 personas en diferentes escenarios. Los tonos de piel cubren blanco/amarillo/marrón/negro, las edades cubren jóvenes/adultos/ancianos. La resolución de video no es inferior a 1.920x1.080, la duración no es inferior a 10 segundos. Este conjunto de datos puede usarse para generación de video con consistencia de personajes, generación de humanos digitales y otras tareas.

Vídeo personas relacionadas Humano digital Generación vídeo

70.303 conjuntos de datos de descripción de imagen y texto de estilo nacional de múltiples países

70.303 conjuntos de datos de descripción de imagen y texto de estilo nacional de múltiples países incluyen varias categorías como pinturas de caligrafía, festivales, ropa, instrumentos musicales, etc., cada imagen ha sido descrita. Estos datos pueden proporcionar recursos ricos para modelos grandes multimodales. Después de ser verificados por múltiples empresas de IA, estos datos ayudan a que los modelos se desempeñen de manera excelente en aplicaciones del mundo real. Durante el proceso de recolección, almacenamiento y uso de datos, siempre seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando que la privacidad y los derechos legítimos de los usuarios sean mantenidos. Todos los datos cumplen con los requisitos regulatorios como GDPR, CCPA y PIPL.

AIGC Características nacionales Descripción de imagen

7.000.000 de conjuntos de datos de alta calidad de descripción de videos

7.000.000 de videos globales de alta calidad con derechos de autor. Todos son obras de video con derechos de autor publicadas por fotógrafos globales. De estos, 6.000.000 tienen descripción en inglés, 1.000.000 tienen descripción en chino. Cubren múltiples categorías como personas, paisajes, animales, etc. La resolución es superior a 1.080p.

multimodal vídeo descripción subtítulos conjunto datos LLM

1.000.000 de conjuntos de datos de descripción de imágenes en escenarios generales (descripción detallada)

1 millón de grupos de imágenes y descripciones, los tipos de imágenes cubren múltiples categorías como paisajes, animales, flores y árboles, personas, automóviles, deportes, industria y arquitectura, y un subconjunto estético, describiendo la escena general de la imagen, detalles en la escena y las emociones expresadas por la imagen, el idioma de descripción es inglés y chino.

Descripción texto multimodalidad conjunto datos escena general subtítulos inglés subtítulos chino

300.000.000 de conjuntos de datos de alta calidad de descripción de imágenes

multimodal imagen descripción

300 millones de imágenes, cada imagen corresponde a una descripción. Todas son obras de imagen con derechos de autor publicadas por fotógrafos. La gran mayoría tiene descripción en inglés, una parte muy pequeña tiene descripción en chino.

Nivel de madurez del proyecto

multimodal

imagen

descripción