[{"@type":"PropertyValue","name":"Formato","value":"16 kHz 16 bit, wav, monoaural"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Categoría diálogo, categoría autopublicación, categoría variedades, etc."},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Bajo nivel de ruido"},{"@type":"PropertyValue","name":"País","value":"Tailandia"},{"@type":"PropertyValue","name":"Código de idioma regional","value":"th-TH"},{"@type":"PropertyValue","name":"Idioma","value":"Tailandés"},{"@type":"PropertyValue","name":"Características de etiquetado","value":"Marcado del contenido del texto, marcas de tiempo de las frases, identificadores del hablante, género, marcadores de ruido"},{"@type":"PropertyValue","name":"Precisión","value":"98% de precisión de las palabras (las etiquetas, los identificadores de género, los identificadores de hablante, los acentos y los temas no se tienen en cuenta en las estadísticas de precisión)"}]
{"id":1687,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"900 horas de datos de voz en tailandés de habla coloquial","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz 16 bit, wav, monoaural"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Categoría diálogo, categoría autopublicación, categoría variedades, etc."},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Bajo nivel de ruido"},{"title":"País","desc":"País","content":"Tailandia"},{"title":"Código de idioma regional","desc":"Código de idioma regional","content":"th-TH"},{"title":"Idioma","desc":"Idioma","content":"Tailandés"},{"title":"Características de etiquetado","desc":"Características de etiquetado","content":"Marcado del contenido del texto, marcas de tiempo de las frases, identificadores del hablante, género, marcadores de ruido"},{"title":"Precisión","desc":"Precisión","content":"98% de precisión de las palabras (las etiquetas, los identificadores de género, los identificadores de hablante, los acentos y los temas no se tienen en cuenta en las estadísticas de precisión)"}],"datatag":"Thai,Casual Conversation,ASR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"500001_6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500001_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=2OvhfaFaWY3zdwE%2BIHh5Rg8oXJg%3D","intro":"คุณผู้ฟังมีความคิดแบบนี้ไหมคะ ในวันที่เราเหนื่อยมากมาก เราท้อมากมาก เราเริ่มไม่อยากจะมีชีวิตอยู่แล้ว","size":241800,"progress":100,"type":"mp3"},{"name":"500002_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500002_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=%2BXu1ouOHCx9fViVsDUxgWwASHxw%3D","intro":"อยู่ที่โคราช แล้วจะมีการซ้อมรบกันอยู่ ฝึกซ้อมรบกันอยู่น่ะ ก็ตั้งชื่อผมอะคลอดพอดี ก็ตั้งชื่อผมว่าประลองยุทธ์","size":253750,"progress":100,"type":"mp3"},{"name":"500004_4.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=UI2MbKqovKI%2Fx0Rl8er4Ho3658w%3D","intro":"ปรุงแต่งอยู่ในนั้น","size":45930,"progress":100,"type":"mp3"},{"name":"500004_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=7Bd6uuRU0TtemREj9fJavah7cRI%3D","intro":"มันก็จะทำให้ใจรู้สึกปฏิเสธมากมาก เนี่ย แล้วมันก็เลยส่งผลออกมาเป็นความจำความรู้สึก","size":185224,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz coloquiales en tailandés, contenido cubre áreas generales como diálogos, redes sociales, programas de variedades, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos está anotado con contenido de texto, identidad del hablante, género y otros atributos. Alta precisión, fuerte usabilidad, proporciona recursos abundantes para la investigación y aplicaciones relacionadas con el reconocimiento de voz, ayudando a que los modelos demuestren un excelente rendimiento frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL.","dataexampl":null,"datakeyword":["Tailandés"," Conversación informal"," ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1004 Hours - Thai(Thailand) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
900 horas de datos de voz en tailandés de habla coloquial
Tailandés
Conversación informal
ASR
Datos de voz coloquiales en tailandés, contenido cubre áreas generales como diálogos, redes sociales, programas de variedades, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos está anotado con contenido de texto, identidad del hablante, género y otros atributos. Alta precisión, fuerte usabilidad, proporciona recursos abundantes para la investigación y aplicaciones relacionadas con el reconocimiento de voz, ayudando a que los modelos demuestren un excelente rendimiento frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, garantizando la protección de la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de datos. Todos los datos cumplen con GDPR, CCPA, PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz 16 bit, wav, monoaural
Clasificación de contenido
Categoría diálogo, categoría autopublicación, categoría variedades, etc.
Entorno de grabación
Bajo nivel de ruido
País
Tailandia
Código de idioma regional
th-TH
Idioma
Tailandés
Características de etiquetado
Marcado del contenido del texto, marcas de tiempo de las frases, identificadores del hablante, género, marcadores de ruido
Precisión
98% de precisión de las palabras (las etiquetas, los identificadores de género, los identificadores de hablante, los acentos y los temas no se tienen en cuenta en las estadísticas de precisión)