Datasets listos para usar, implemente IA competitiva con Nexdata

288 millones de conjuntos de datos de modelos 3D y escenas

288 millones de conjuntos de datos de modelos 3D y escenas, incluyendo 270 millones de conjuntos de datos de modelos 3D y 18 millones de conjuntos de datos de escenas 3D, donde los modelos 3D cubren varios tipos como modelos regulares, modelos interactivos y modelos físicamente mejorados, así como diversos objetos en entornos de muebles para interiores, y las escenas 3D cubren escenas de decoración de interiores y escenas de espacios comerciales. Este conjunto de datos puede utilizarse para tareas como la generación de activos 3D y la construcción de entornos de entrenamiento de simulación.

Conjunto de datos de modelos 3D conjunto de datos de escenas 3D conjunto de datos de entornos 3D interiores conjunto de datos de espacios comerciales 3D modelos 3D físicamente mejorados conjunto de datos de modelos 3D interactivos conjunto de datos de generación de activos 3D conjunto de datos de entorno de entrenamiento de simulación datos 3D de entorno virtual conjunto de datos de IA 3D a gran escala

Conjunto de datos para competición de voz de diálogo multilingüe Interspeech2025-MLC-SLM

El contexto del conjunto de datos para la competición de voz de diálogo multilingüe Interspeech2025-MLC-SLM es que Datatang organizó la competición de voz de diálogo multilingüe MLC-SLM en 2025, el conjunto de datos proviene de quince conjuntos de datos de voz de diálogo propios de Datatang. Los datos tienen alta precisión y fuerte facilidad de uso, están diseñados específicamente para superar los cuellos de botella tecnológicos del reconocimiento de voz multilingüe y la comprensión de contexto largo, capturan de manera realista escenarios de interacción complejos como la superposición de hablantes e interrupciones improvisadas, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Conjunto de datos de audio de taller conjunto de datos MLC-SLM datos de reconocimiento de voz ASR

111 horas de datos de voz de lectura en griego recogidos por móvil

Datos de voz en griego de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con un total de 95 grabadores, los grabadores son de Grecia, el entorno de grabación es silencioso y sin eco. El contenido de la grabación es extenso, aproximadamente 1000 oraciones por persona. El texto ha sido corregido manualmente, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Conjunto de datos de monólogo guionizado en griego conjunto de datos de voz en griego conjunto de datos de audio en griego datos de voz en griego datos de síntesis de voz en griego

280 horas de datos de voz de lectura en noruego recogidos por móvil

Datos de voz en noruego de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con un total de 157 grabadores, los grabadores son de Noruega, el entorno de grabación es silencioso y sin eco. El contenido de la grabación es extenso, aproximadamente 1000 oraciones por persona. El texto ha sido corregido manualmente, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Conjunto de datos de monólogo guionizado en noruego conjunto de datos de voz en noruego datos de síntesis de voz en noruego corpus NLP para noruego datos de voz en noruego conjunto de datos de audio en noruego

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países. Los datos incluyen 21 idiomas, con una distribución de 20,000 a 25,000 imágenes por idioma. Los tipos de datos incluyen escenas naturales, escenas de fotos de documentos y escenas electrónicas. La diversidad de datos incluye múltiples tipos de datos, múltiples ángulos de captura y múltiples idiomas. En cuanto a la anotación, se utiliza anotación a nivel de fila (columna) con cuadriláteros o polígonos y transcripción de contenido a nivel de fila (columna). Los datos pueden utilizarse para tareas de reconocimiento OCR multilingüe.

Conjunto de datos OCR multilingüe datos de reconocimiento de texto en escenas conjunto de datos OCR de documentos datos OCR de pantallas electrónicas conjunto de datos OCR 21 idiomas datos de entrenamiento OCR para IA conjunto de datos de reconocimiento de texto

200.000 conjuntos de datos de imagen y texto de edificios emblemáticos de múltiples países

200.000 conjuntos de datos de imagen y texto de edificios emblemáticos de múltiples países. Cada conjunto de datos contiene una imagen + un documento de descripción en chino e inglés. Los hitos nacionales incluyen 80.000 conjuntos, y los hitos de otros países 120.000 conjuntos. La distribución de países incluye no menos de 20 países, incluyendo Estados Unidos, Reino Unido, Francia, Rusia, Alemania, etc. El número de imágenes correspondientes a cada hito se distribuye entre 1 y 10 imágenes, incluyendo información del hito desde diferentes ángulos, distancias y períodos de tiempo. Los tipos de hitos incluyen varios tipos de edificios emblemáticos, como rascacielos comerciales, edificios antiguos, monumentos, bibliotecas, atracciones turísticas, etc. En cuanto al contenido de la anotación, se anota el país del hito, la ciudad del hito, la ubicación específica del hito, la clasificación del hito y la descripción del hito. Los datos pueden utilizarse para el reconocimiento y análisis de edificios emblemáticos.

Conjunto de datos de imágenes de hitos conjunto de datos de reconocimiento de edificios conjunto de datos de descripción de imágenes de hitos globales datos de descripción de imágenes bilingües conjunto de datos de descripción chino-inglés conjunto de datos de clasificación de hitos conjunto de datos de imagen y texto conjunto de datos de hitos turísticos conjunto de datos de imágenes de patrimonio cultural descripción de imágenes para entrenamiento de IA

581 horas de datos de voz coloquial en griego

Datos de voz coloquial en griego, con contenido que cubre áreas generales como medios sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por múltiples rumanos de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Conjunto de datos de voz en griego datos de entrenamiento ASR para griego corpus de conversación en griego voz monólogo en griego conjunto de datos de reconocimiento de voz en griego datos de voz a texto en griego conjunto de datos de voz en griego conjunto de datos de transcripción en griego

600 horas de datos de voz coloquial en noruego

Datos de voz coloquial en noruego, con contenido que cubre áreas generales como medios sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por múltiples rumanos de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

conjunto de datos de voz en noruego datos de entrenamiento ASR para noruego corpus de conversación en noruego voz monólogo en noruego conjunto de datos de reconocimiento de voz en noruego datos de voz a texto en noruego conjunto de datos de voz en noruego datos de voz multilingües conjunto de datos de transcripción en noruego

Conjunto de datos de síntesis de alta fidelidad para escenas 3D_ Cabina

Conjunto de datos de síntesis de alta fidelidad para escenas 3D_ Cabina, datos de salida de sensores sintetizados por modelado de escenas 3D altamente similares al mundo real, que incluyen imágenes de cámara, secuencias de video y nubes de puntos, etc. Las anotaciones que se pueden proporcionar incluyen, entre otras, parámetros de cámara, categoría/detección/segmentación de objetivos, metainformación de tiempo/iluminación/clima, posición y dirección de cabeza/ojos/brazos/piernas y otras posturas corporales. Este conjunto de datos puede utilizarse para el modelado ambiental y la síntesis de datos en conducción autónoma, robótica, etc.

Datos sintéticos 3D conjunto de datos sintéticos de monitorización del conductor datos sintéticos de conducción autónoma conjunto de datos de simulación de alta fidelidad datos sintéticos de nube de puntos conjunto de datos de simulación de cámara conjunto de datos sintéticos de postura humana conjunto de datos sintéticos de lidar modelado de entorno 3D datos sintéticos para robótica conjunto de datos DMS

Datos textuales de la plataforma de preguntas-respuestas japonesa OKWAVE

Datos de texto de la plataforma de preguntas y respuestas OKWAVE de Japón, que contienen múltiples campos como pregunta, respuesta, categoría, fecha de publicación, autor de la publicación; los datos se actualizan continuamente. Hasta finales de abril de 2025: 8,4 millones de preguntas, 2,3 mil millones de caracteres; 27 millones de respuestas, 7,6 mil millones de caracteres; 15,5 millones de agradecimientos (agradecimientos expresados por el que pregunta al que responde), 1,7 mil millones de caracteres; 2,1 millones de explicaciones complementarias, 360 millones de caracteres; estos datos pueden usarse para el entrenamiento de modelos grandes generales.

Pregunta-respuesta Texto Japonés

500 horas de datos de voz de lectura en tamil recogidos por móvil

Datos de voz en tamil de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con contenido rico. Este conjunto de datos anota múltiples atributos como el contenido de texto, etc., con 479 personas locales participando en la recolección, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Conjunto de datos de voz en tamil conjunto de datos de audio en tamil conjunto de datos de idioma tamil conjunto de datos de monólogo en tamil corpus de voz en tamil datos ASR para tamil voz guionizada en tamil conjunto de datos de tamil por smartphone conjunto de datos de reconocimiento de voz para tamil datos de voz multilingües

500 horas de datos de voz de lectura en laosiano recogidos por móvil

Datos de voz en laosiano de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con contenido rico. Este conjunto de datos anota múltiples atributos como el contenido de texto, etc., con 418 personas locales participando en la recolección, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.

Conjunto de datos de voz en laosiano conjunto de datos de voz monólogo en laosiano conjunto de datos de voz guionizada en laosiano conjunto de datos de voz en laosiano por smartphone conjunto de datos de voz en laosiano para TTS conjunto de datos de audio en laosiano conjunto de datos de voz en laosiano para ASR