[{"@type":"PropertyValue","name":"Formato","value":"24 kHz, 16 bits, wav sin comprimir, mono"},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Interior relativamente silencioso, sin eco"},{"@type":"PropertyValue","name":"Contenido de la grabación","value":"Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema"},{"@type":"PropertyValue","name":"Personal","value":"Aproximadamente 800 locutores, provenientes de condados y ciudades de la región de Kunming, proporción equilibrada entre hombres y mujeres, cubriendo múltiples grupos de edad"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, la explicación en mandarín, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante"},{"@type":"PropertyValue","name":"Equipos","value":"Teléfonos Android, iPhone"},{"@type":"PropertyValue","name":"Idioma","value":"Dialecto de Kunming"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de carácter 98%; Precisión de anotación en mandarín 90%"},{"@type":"PropertyValue","name":"Escenarios de aplicación","value":"Reconocimiento de voz, reconocimiento de voz del hablante"}]
{"id":1684,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"800 horas de datos de voz de conversación natural en dialecto de Kunming (con anotación bilingüe) recogidos por móvil","datazy":[{"title":"Formato","desc":"Formato","content":"24 kHz, 16 bits, wav sin comprimir, mono"},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Interior relativamente silencioso, sin eco"},{"title":"Contenido de la grabación","desc":"Contenido de la grabación","content":"Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema"},{"title":"Personal","desc":"Personal","content":"Aproximadamente 800 locutores, provenientes de condados y ciudades de la región de Kunming, proporción equilibrada entre hombres y mujeres, cubriendo múltiples grupos de edad"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, la explicación en mandarín, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante"},{"title":"Equipos","desc":"Equipos","content":"Teléfonos Android, iPhone"},{"title":"Idioma","desc":"Idioma","content":"Dialecto de Kunming"},{"title":"Precisión","desc":"Precisión","content":"Precisión de carácter 98%; Precisión de anotación en mandarín 90%"},{"title":"Escenarios de aplicación","desc":"Escenarios de aplicación","content":"Reconocimiento de voz, reconocimiento de voz del hablante"}],"datatag":"Dialect ,Conversation ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00009_004_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gCL0fUr7gGBbXi5MWKgLxOu%2F8z8%3D","intro":"豆花米线店,它是,开的开的哪边啊?[N]\t豆花米线店,它是,开在开在哪边啊?","size":157820,"progress":100,"type":"mp3"},{"name":"00009_004_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=FTY65FZaGU5NVmUaSvVXnXLyqI8%3D","intro":"它是开来,它连锁店有好几家呢,我看,它它它在,是在这个那个。[N]\t它是开在,它连锁店有好几家的,我看,它它它在,是在这个那个。","size":275036,"progress":100,"type":"mp3"},{"name":"00009_004_phone-3.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TNxhQp%2BD5SDS4MPhUvTG2t73HCc%3D","intro":"光华广场对面这点。\t光华广场对面这里。","size":63596,"progress":100,"type":"mp3"},{"name":"00009_004_phone-4.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=0dVc9aMy%2Fb70HMajyyvQkqm5DoQ%3D","intro":"呃,有家,这家大点,呃,然后么,你说是,昆明正儿八经。\t呃,有家,这家大点,呃,然后呢,你说是,昆明正儿八经。","size":249740,"progress":100,"type":"mp3"},{"name":"00009_004_phone-5.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20250722180035/00009_004_phone-5.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=OuJ6SR9FfFEveJjkZier7OfanSM%3D","intro":"好吃点呢嘎,卤面这块么,卤面,豆花米线么就是就是这一家,如果是卤面么。\t好吃点的啊,卤面这块呢,卤面,豆花米线呢就是就是这一家,如果是卤面呢。","size":310412,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz en dialecto de Kunming de conversación (móvil), donde los grabadores conversan libremente y se graban. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por usuarios nativos del dialecto, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["ast"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"655 Hours - Kunming Dialect Conversation (Bilingual Annotated) Speech Data by Mobile Phone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
800 horas de datos de voz de conversación natural en dialecto de Kunming (con anotación bilingüe) recogidos por móvil
ast
Datos de voz en dialecto de Kunming de conversación (móvil), donde los grabadores conversan libremente y se graban. Este conjunto de datos anota múltiples atributos como el contenido de texto, marcas de tiempo por oración, identidad del hablante, género, etc., grabados por usuarios nativos del dialecto, con alta precisión, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ha sido verificado por múltiples empresas de IA: ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
24 kHz, 16 bits, wav sin comprimir, mono
Entorno de grabación
Interior relativamente silencioso, sin eco
Contenido de la grabación
Se proporciona una lista de temas, los locutores seleccionan múltiples temas que les sean familiares para garantizar una conversación fluida y natural, desarrollando y grabando un diálogo en torno a cada tema
Personal
Aproximadamente 800 locutores, provenientes de condados y ciudades de la región de Kunming, proporción equilibrada entre hombres y mujeres, cubriendo múltiples grupos de edad
Características de la anotación
Se anota el contenido del texto, la explicación en mandarín, los puntos de tiempo de inicio y fin de las oraciones válidas, y la identificación del hablante
Equipos
Teléfonos Android, iPhone
Idioma
Dialecto de Kunming
Precisión
Precisión de carácter 98%; Precisión de anotación en mandarín 90%
Escenarios de aplicación
Reconocimiento de voz, reconocimiento de voz del hablante