en

Please fill in your name

Mobile phone format error

Ingrese el teléfono

Introduzca el nombre de su empresa

Introduzca el correo electrónico de su empresa.

Ingrese los datos requeridos

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

El requisito de datos no puede ser inferior a 5 palabras y no pueden ser números puros.

Datasets de entrenamiento de alta calidad

Mejore el rendimiento de sus modelos de IA con nuestros Datasets de entrenamiento de alta calidad y listos para usar.

Idioma

Todo

Tipo de dato

Todo

Biblioteca de síntesis de timbre promedio de narración con alta expresividad en chino de 4 personas

Biblioteca de síntesis de timbre promedio de narración con alta expresividad en chino de 4 personas, recogida por actores de voz profesionales, dado un libro, los hablantes leen en un estilo de narración con alta expresividad.
Alta expresividad Narración TTS Chino

Biblioteca de síntesis de timbre promedio multiestilo y multiemocional de 5 personas

Biblioteca de síntesis de timbre promedio multiestilo y multiemocional de 5 personas, recogida por actores de voz profesionales. Los estilos incluyen 4 tipos: jefa eficiente, príncipe franco, criada ágil y anciana bondadosa; las emociones incluyen desdén, ira, alegría, preocupación, sorpresa, jadeo de miedo, resoplido (desdén), simpatía, risa, actividad mental, seriedad, disgusto, duda y neutral.
Corpus de Síntesis TTS Mandarín Chino Multiestilo Multiemocional

288 millones de conjuntos de datos de modelos 3D y escenas

288 millones de conjuntos de datos de modelos 3D y escenas, incluyendo 270 millones de conjuntos de datos de modelos 3D y 18 millones de conjuntos de datos de escenas 3D, donde los modelos 3D cubren varios tipos como modelos regulares, modelos interactivos y modelos físicamente mejorados, así como diversos objetos en entornos de muebles para interiores, y las escenas 3D cubren escenas de decoración de interiores y escenas de espacios comerciales. Este conjunto de datos puede utilizarse para tareas como la generación de activos 3D y la construcción de entornos de entrenamiento de simulación.
Conjunto de datos de modelos 3D conjunto de datos de escenas 3D conjunto de datos de entornos 3D interiores conjunto de datos de espacios comerciales 3D modelos 3D físicamente mejorados conjunto de datos de modelos 3D interactivos conjunto de datos de generación de activos 3D conjunto de datos de entorno de entrenamiento de simulación datos 3D de entorno virtual conjunto de datos de IA 3D a gran escala

Conjunto de datos para competición de voz de diálogo multilingüe Interspeech2025-MLC-SLM

El contexto del conjunto de datos para la competición de voz de diálogo multilingüe Interspeech2025-MLC-SLM es que Datatang organizó la competición de voz de diálogo multilingüe MLC-SLM en 2025, el conjunto de datos proviene de quince conjuntos de datos de voz de diálogo propios de Datatang. Los datos tienen alta precisión y fuerte facilidad de uso, están diseñados específicamente para superar los cuellos de botella tecnológicos del reconocimiento de voz multilingüe y la comprensión de contexto largo, capturan de manera realista escenarios de interacción complejos como la superposición de hablantes e interrupciones improvisadas, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Conjunto de datos de audio de taller conjunto de datos MLC-SLM datos de reconocimiento de voz ASR

3000 horas de datos de voz de conversación natural en mandarín full-duplex

Datos de voz de conversación natural en mandarín full-duplex, basados en diálogos de temas comunes grabados. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Full-Duplex Diálogo Mandarín

119 horas de datos de voz de lectura en griego recogidos por móvil

Datos de voz en griego de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con un total de 95 grabadores, los grabadores son de Grecia, el entorno de grabación es silencioso y sin eco. El contenido de la grabación es extenso, aproximadamente 1000 oraciones por persona. El texto ha sido corregido manualmente, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Conjunto de datos de monólogo guionizado en griego conjunto de datos de voz en griego conjunto de datos de audio en griego datos de voz en griego datos de síntesis de voz en griego

280 horas de datos de voz de lectura en noruego recogidos por móvil

Datos de voz en noruego de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con un total de 157 grabadores, los grabadores son de Noruega, el entorno de grabación es silencioso y sin eco. El contenido de la grabación es extenso, aproximadamente 1000 oraciones por persona. El texto ha sido corregido manualmente, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Conjunto de datos de monólogo guionizado en noruego conjunto de datos de voz en noruego datos de síntesis de voz en noruego corpus NLP para noruego datos de voz en noruego conjunto de datos de audio en noruego

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países

500.000 imágenes de datos de anotación OCR de escenas naturales, escenas de fotos de documentos y escenas electrónicas de 21 países. Los datos incluyen 21 idiomas, con una distribución de 20,000 a 25,000 imágenes por idioma. Los tipos de datos incluyen escenas naturales, escenas de fotos de documentos y escenas electrónicas. La diversidad de datos incluye múltiples tipos de datos, múltiples ángulos de captura y múltiples idiomas. En cuanto a la anotación, se utiliza anotación a nivel de fila (columna) con cuadriláteros o polígonos y transcripción de contenido a nivel de fila (columna). Los datos pueden utilizarse para tareas de reconocimiento OCR multilingüe.
Conjunto de datos OCR multilingüe datos de reconocimiento de texto en escenas conjunto de datos OCR de documentos datos OCR de pantallas electrónicas conjunto de datos OCR 21 idiomas datos de entrenamiento OCR para IA conjunto de datos de reconocimiento de texto

200.000 conjuntos de datos de imagen y texto de edificios emblemáticos de múltiples países

200.000 conjuntos de datos de imagen y texto de edificios emblemáticos de múltiples países. Cada conjunto de datos contiene una imagen + un documento de descripción en chino e inglés. Los hitos nacionales incluyen 80.000 conjuntos, y los hitos de otros países 120.000 conjuntos. La distribución de países incluye no menos de 20 países, incluyendo Estados Unidos, Reino Unido, Francia, Rusia, Alemania, etc. El número de imágenes correspondientes a cada hito se distribuye entre 1 y 10 imágenes, incluyendo información del hito desde diferentes ángulos, distancias y períodos de tiempo. Los tipos de hitos incluyen varios tipos de edificios emblemáticos, como rascacielos comerciales, edificios antiguos, monumentos, bibliotecas, atracciones turísticas, etc. En cuanto al contenido de la anotación, se anota el país del hito, la ciudad del hito, la ubicación específica del hito, la clasificación del hito y la descripción del hito. Los datos pueden utilizarse para el reconocimiento y análisis de edificios emblemáticos.
Conjunto de datos de imágenes de hitos conjunto de datos de reconocimiento de edificios conjunto de datos de descripción de imágenes de hitos globales datos de descripción de imágenes bilingües conjunto de datos de descripción chino-inglés conjunto de datos de clasificación de hitos conjunto de datos de imagen y texto conjunto de datos de hitos turísticos conjunto de datos de imágenes de patrimonio cultural descripción de imágenes para entrenamiento de IA

600 horas de datos de voz coloquial en griego

Datos de voz coloquial en griego, con contenido que cubre áreas generales como medios sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por múltiples rumanos de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Conjunto de datos de voz en griego datos de entrenamiento ASR para griego corpus de conversación en griego voz monólogo en griego conjunto de datos de reconocimiento de voz en griego datos de voz a texto en griego conjunto de datos de voz en griego conjunto de datos de transcripción en griego

600 horas de datos de voz coloquial en noruego

Datos de voz coloquial en noruego, con contenido que cubre áreas generales como medios sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por múltiples rumanos de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
conjunto de datos de voz en noruego datos de entrenamiento ASR para noruego corpus de conversación en noruego voz monólogo en noruego conjunto de datos de reconocimiento de voz en noruego datos de voz a texto en noruego conjunto de datos de voz en noruego datos de voz multilingües conjunto de datos de transcripción en noruego

Conjunto de datos de síntesis de alta fidelidad para escenas 3D_ Cabina

Conjunto de datos de síntesis de alta fidelidad para escenas 3D_ Cabina, datos de salida de sensores sintetizados por modelado de escenas 3D altamente similares al mundo real, que incluyen imágenes de cámara, secuencias de video y nubes de puntos, etc. Las anotaciones que se pueden proporcionar incluyen, entre otras, parámetros de cámara, categoría/detección/segmentación de objetivos, metainformación de tiempo/iluminación/clima, posición y dirección de cabeza/ojos/brazos/piernas y otras posturas corporales. Este conjunto de datos puede utilizarse para el modelado ambiental y la síntesis de datos en conducción autónoma, robótica, etc.
Datos sintéticos 3D conjunto de datos sintéticos de monitorización del conductor datos sintéticos de conducción autónoma conjunto de datos de simulación de alta fidelidad datos sintéticos de nube de puntos conjunto de datos de simulación de cámara conjunto de datos sintéticos de postura humana conjunto de datos sintéticos de lidar modelado de entorno 3D datos sintéticos para robótica conjunto de datos DMS
. . .
loading

loading

a676b55c-4d16-49ba-9017-63e88805afd4