[{"@type":"PropertyValue","name":"Escala de datos","value":"300 millones de imágenes, cada imagen con una descripción. Galería completa (incluye fotos + gráficos vectoriales, etc.) total casi 300 millones. Galería completa utilizable para entrenamiento de IA generativa (fotos editadas/fotos de noticias eliminadas + gráficos vectoriales) total aproximadamente 100 millones."},{"@type":"PropertyValue","name":"Formato de datos","value":"Formato de datos de imagen incluye .jpg, .png, .svg; formato de documento descriptivo es .txt"},{"@type":"PropertyValue","name":"Contenido de los datos","value":"Obras gráficas originales publicadas por autores con sus descripciones"},{"@type":"PropertyValue","name":"Tipos de imágenes","value":"Fotografías y vectores que cubren una amplia gama de categorías de escenarios"},{"@type":"PropertyValue","name":"Resolución de imagen","value":"4K y superiores"},{"@type":"PropertyValue","name":"Lenguaje de descripción","value":"La mayoría de las descripciones están en inglés, muy pocas en chino."}]
{"id":1451,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"300.000.000 de conjuntos de datos de alta calidad de descripción de imágenes","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"300 millones de imágenes, cada imagen con una descripción. Galería completa (incluye fotos + gráficos vectoriales, etc.) total casi 300 millones. Galería completa utilizable para entrenamiento de IA generativa (fotos editadas/fotos de noticias eliminadas + gráficos vectoriales) total aproximadamente 100 millones."},{"title":"Formato de datos","desc":"Formato de datos","content":"Formato de datos de imagen incluye .jpg, .png, .svg; formato de documento descriptivo es .txt"},{"title":"Contenido de los datos","desc":"Contenido de los datos","content":"Obras gráficas originales publicadas por autores con sus descripciones"},{"title":"Tipos de imágenes","desc":"Tipos de imágenes","content":"Fotografías y vectores que cubren una amplia gama de categorías de escenarios"},{"title":"Resolución de imagen","desc":"Resolución de imagen","content":"4K y superiores"},{"title":"Lenguaje de descripción","desc":"Lenguaje de descripción","content":"La mayoría de las descripciones están en inglés, muy pocas en chino."}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"300 millones de imágenes, cada imagen corresponde a una descripción. Todas son obras de imagen con derechos de autor publicadas por fotógrafos. La gran mayoría tiene descripción en inglés, una parte muy pequeña tiene descripción en chino.","dataexampl":null,"datakeyword":["multimodal"," imagen"," descripción"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"300 million pairs of high-quality image-caption dataset","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
300.000.000 de conjuntos de datos de alta calidad de descripción de imágenes
multimodal
imagen
descripción
300 millones de imágenes, cada imagen corresponde a una descripción. Todas son obras de imagen con derechos de autor publicadas por fotógrafos. La gran mayoría tiene descripción en inglés, una parte muy pequeña tiene descripción en chino.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Escala de datos
300 millones de imágenes, cada imagen con una descripción. Galería completa (incluye fotos + gráficos vectoriales, etc.) total casi 300 millones. Galería completa utilizable para entrenamiento de IA generativa (fotos editadas/fotos de noticias eliminadas + gráficos vectoriales) total aproximadamente 100 millones.
Formato de datos
Formato de datos de imagen incluye .jpg, .png, .svg; formato de documento descriptivo es .txt
Contenido de los datos
Obras gráficas originales publicadas por autores con sus descripciones
Tipos de imágenes
Fotografías y vectores que cubren una amplia gama de categorías de escenarios
Resolución de imagen
4K y superiores
Lenguaje de descripción
La mayoría de las descripciones están en inglés, muy pocas en chino.