[{"@type":"PropertyValue","name":"Escala de datos","value":"120,000 conjuntos"},{"@type":"PropertyValue","name":"Resolución de imagen","value":"La resolución del lado corto de la imagen no es inferior a 500 píxeles"},{"@type":"PropertyValue","name":"Categorías de disciplinas","value":"Seis categorías principales: Arte, Negocios, Ciencias, Medicina, Humanidades y Ciencias Sociales, Ingeniería"},{"@type":"PropertyValue","name":"Longitud de preguntas y respuestas","value":"La longitud de la pregunta no menos de 10 caracteres chinos, la longitud de la respuesta y el análisis no menos de 40 caracteres"},{"@type":"PropertyValue","name":"Dispositivos de recolección","value":"Teléfono móvil, escáner"},{"@type":"PropertyValue","name":"Diversidad de recolección","value":"Múltiples disciplinas, múltiples tipos de imagen, múltiples tipos de preguntas"},{"@type":"PropertyValue","name":"Formatos de datos","value":".jpg, .png, .json"}]
{"id":1751,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"120.000 conjuntos de datos de comprensión y razonamiento multimodal multidisciplinarios","datazy":[{"title":"Escala de datos","desc":"Escala de datos","content":"120,000 conjuntos"},{"title":"Resolución de imagen","desc":"Resolución de imagen","content":"La resolución del lado corto de la imagen no es inferior a 500 píxeles"},{"title":"Categorías de disciplinas","desc":"Categorías de disciplinas","content":"Seis categorías principales: Arte, Negocios, Ciencias, Medicina, Humanidades y Ciencias Sociales, Ingeniería"},{"title":"Longitud de preguntas y respuestas","desc":"Longitud de preguntas y respuestas","content":"La longitud de la pregunta no menos de 10 caracteres chinos, la longitud de la respuesta y el análisis no menos de 40 caracteres"},{"title":"Dispositivos de recolección","desc":"Dispositivos de recolección","content":"Teléfono móvil, escáner"},{"title":"Diversidad de recolección","desc":"Diversidad de recolección","content":"Múltiples disciplinas, múltiples tipos de imagen, múltiples tipos de preguntas"},{"title":"Formatos de datos","desc":"Formatos de datos","content":".jpg, .png, .json"}],"datatag":"VQA,VLM,LLM,MMMU","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"120.000 conjuntos de datos de comprensión y razonamiento multimodal multidisciplinarios, que cubren 6 grandes disciplinas como arte, ingeniería, medicina y múltiples áreas especializadas con problemas mixtos de imagen y texto a nivel profesional (como gráficos, planos de ingeniería, análisis de obras de arte, etc.), cada problema ha sido verificado en calidad por personal profesional. Este conjunto de datos integra comprensión profunda de información textual y visual, y puede utilizarse para mejorar las capacidades de razonamiento lógico y aplicación de conocimiento de modelos grandes. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos multimodal"," conjunto de datos VQA"," datos de preguntas y respuestas multimodales"," conjunto de datos de razonamiento para IA"," conjunto de datos de preguntas y respuestas con imagen y texto"," datos de entrenamiento de IA para dominios específicos"," conjunto de datos de razonamiento con gráficos"," datos de entrenamiento multimodal para LLM"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"103,975 Questions - Multi-discipline Multi-modal Understanding & Reasoning Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://es.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[]
120.000 conjuntos de datos de comprensión y razonamiento multimodal multidisciplinarios
Conjunto de datos multimodal
conjunto de datos VQA
datos de preguntas y respuestas multimodales
conjunto de datos de razonamiento para IA
conjunto de datos de preguntas y respuestas con imagen y texto
datos de entrenamiento de IA para dominios específicos
conjunto de datos de razonamiento con gráficos
datos de entrenamiento multimodal para LLM
120.000 conjuntos de datos de comprensión y razonamiento multimodal multidisciplinarios, que cubren 6 grandes disciplinas como arte, ingeniería, medicina y múltiples áreas especializadas con problemas mixtos de imagen y texto a nivel profesional (como gráficos, planos de ingeniería, análisis de obras de arte, etc.), cada problema ha sido verificado en calidad por personal profesional. Este conjunto de datos integra comprensión profunda de información textual y visual, y puede utilizarse para mejorar las capacidades de razonamiento lógico y aplicación de conocimiento de modelos grandes. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
![Especificaciones]()
Especificaciones
Escala de datos
120,000 conjuntos
Resolución de imagen
La resolución del lado corto de la imagen no es inferior a 500 píxeles
Categorías de disciplinas
Seis categorías principales: Arte, Negocios, Ciencias, Medicina, Humanidades y Ciencias Sociales, Ingeniería
Longitud de preguntas y respuestas
La longitud de la pregunta no menos de 10 caracteres chinos, la longitud de la respuesta y el análisis no menos de 40 caracteres
Dispositivos de recolección
Teléfono móvil, escáner
Diversidad de recolección
Múltiples disciplinas, múltiples tipos de imagen, múltiples tipos de preguntas
Formatos de datos
.jpg, .png, .json
![Ejemplo]()
Ejemplo
![Recommended Datasets]()
Dataset recomendado
Indíquenos sus necesidades especiales
61b0f649-ff02-4f86-b6a5-e2cc514474f5