[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, wav sin comprimir, mono."},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Noticias y textos de tipo general."},{"@type":"PropertyValue","name":"Condiciones de grabación","value":"Interior relativamente silencioso, sin eco."},{"@type":"PropertyValue","name":"Dispositivos de grabación","value":"iPhone, teléfonos Android."},{"@type":"PropertyValue","name":"Información del locutor","value":"Total 479 locutores, de los cuales 231 hombres, 248 mujeres."},{"@type":"PropertyValue","name":"País","value":"India"},{"@type":"PropertyValue","name":"Idioma","value":"Tamil"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto."},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra 95%."}]
{"id":1838,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"500 horas de datos de voz de lectura en tamil recogidos por móvil","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, wav sin comprimir, mono."},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Noticias y textos de tipo general."},{"title":"Condiciones de grabación","desc":"Condiciones de grabación","content":"Interior relativamente silencioso, sin eco."},{"title":"Dispositivos de grabación","desc":"Dispositivos de grabación","content":"iPhone, teléfonos Android."},{"title":"Información del locutor","desc":"Información del locutor","content":"Total 479 locutores, de los cuales 231 hombres, 248 mujeres."},{"title":"País","desc":"País","content":"India"},{"title":"Idioma","desc":"Idioma","content":"Tamil"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto."},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra 95%."}],"datatag":"reading,Tamil","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"G00001S0001.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709152612/G00001S0001.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=uAjPdqhYWF5Lg7x6%2FP8ZxME99ec%3D","intro":"ஒவ்வொரு மாணவர்களின் வளர்ச்சிக்கும் பள்ளிக்கூடம் மிகவும் அவசியமானது.","size":163512,"progress":100,"type":"mp3"},{"name":"G00001S0002.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709152612/G00001S0002.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=%2BpTGEcpJOHfiEGmG%2Bl4FEEoApSQ%3D","intro":"எனது தமிழ் பாடப்புத்தகத்தில் சரியா அல்லது தவறா கேள்விகள் கேட்கப்பட்டுள்ளது.","size":183374,"progress":100,"type":"mp3"},{"name":"G00001S0003.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709152612/G00001S0003.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=iREXsf4B%2Bfx%2FXble0p2fM7OsbWY%3D","intro":"சீன வாய்மொழி கற்றுக்கொள்ள ஆசை.","size":77320,"progress":100,"type":"mp3"},{"name":"G00001S0004.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709152612/G00001S0004.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=Itrg%2FIM1buUsD%2FALub4aP96h4t0%3D","intro":"பாடத்திட்டத்தில் கணிதம் எனக்கு மிகவும் பிடிக்கும்.","size":104070,"progress":100,"type":"mp3"},{"name":"G00001S0005.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250709152612/G00001S0005.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=xWaKI4vvM%2FLmOgsIuVKBUGz1gxI%3D","intro":"பாடத்திட்டத்தில் அந்நிய மொழிகளை தவிர்க்க வேண்டும்.","size":107042,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz en tamil de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con contenido rico. Este conjunto de datos anota múltiples atributos como el contenido de texto, etc., con 479 personas locales participando en la recolección, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["Conjunto de datos de voz en tamil"," conjunto de datos de audio en tamil"," conjunto de datos de idioma tamil"," conjunto de datos de monólogo en tamil"," corpus de voz en tamil"," datos ASR para tamil"," voz guionizada en tamil"," conjunto de datos de tamil por smartphone"," conjunto de datos de reconocimiento de voz para tamil"," datos de voz multilingües"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"500 Hours - Tamil Scripted Monologue Smartphone Speech Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
500 horas de datos de voz de lectura en tamil recogidos por móvil
Conjunto de datos de voz en tamil
conjunto de datos de audio en tamil
conjunto de datos de idioma tamil
conjunto de datos de monólogo en tamil
corpus de voz en tamil
datos ASR para tamil
voz guionizada en tamil
conjunto de datos de tamil por smartphone
conjunto de datos de reconocimiento de voz para tamil
datos de voz multilingües
Datos de voz en tamil de lectura (móvil), basados en guiones dados para lectura y grabación simulada, con contenido rico. Este conjunto de datos anota múltiples atributos como el contenido de texto, etc., con 479 personas locales participando en la recolección, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, wav sin comprimir, mono.
Clasificación de contenido
Noticias y textos de tipo general.
Condiciones de grabación
Interior relativamente silencioso, sin eco.
Dispositivos de grabación
iPhone, teléfonos Android.
Información del locutor
Total 479 locutores, de los cuales 231 hombres, 248 mujeres.
País
India
Idioma
Tamil
Características de la anotación
Se anota el contenido del texto.
Precisión
Precisión de palabra 95%.
Ejemplo
Audio
ஒவ்வொரு மாணவர்களின் வளர்ச்சிக்கும் பள்ளிக்கூடம் மிகவும் அவசியமானது.
Audio
எனது தமிழ் பாடப்புத்தகத்தில் சரியா அல்லது தவறா கேள்விகள் கேட்கப்பட்டுள்ளது.
Audio
சீன வாய்மொழி கற்றுக்கொள்ள ஆசை.
Audio
பாடத்திட்டத்தில் கணிதம் எனக்கு மிகவும் பிடிக்கும்.
Audio
பாடத்திட்டத்தில் அந்நிய மொழிகளை தவிர்க்க வேண்டும்.