[{"@type":"PropertyValue","name":"Formato","value":"16 kHz 16 bit, wav, monoaural"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Los contenidos abarcan una amplia gama de ámbitos, como variedades, entrevistas, diálogos y reseñas"},{"@type":"PropertyValue","name":"Características de etiquetado","value":"Segmentación y anotación de frases válidas, incluyendo puntos de inicio/fin, identificador de hablante y contenido textual"},{"@type":"PropertyValue","name":"Idioma","value":"Portugués brasileño"},{"@type":"PropertyValue","name":"Código de idioma regional","value":"pt-BR"},{"@type":"PropertyValue","name":"País","value":"Brasileño"},{"@type":"PropertyValue","name":"Escenarios de aplicación","value":"Reconocimiento de voz, generación de subtítulos, revisión de contenido"},{"@type":"PropertyValue","name":"Precisión","value":"Tasa de exactitud por palabra 98%"}]
{"id":1334,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"500 horas de datos de voz portugués brasileño_Coloquial","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz 16 bit, wav, monoaural"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Los contenidos abarcan una amplia gama de ámbitos, como variedades, entrevistas, diálogos y reseñas"},{"title":"Características de etiquetado","desc":"Características de etiquetado","content":"Segmentación y anotación de frases válidas, incluyendo puntos de inicio/fin, identificador de hablante y contenido textual"},{"title":"Idioma","desc":"Idioma","content":"Portugués brasileño"},{"title":"Código de idioma regional","desc":"Código de idioma regional","content":"pt-BR"},{"title":"País","desc":"País","content":"Brasileño"},{"title":"Escenarios de aplicación","desc":"Escenarios de aplicación","content":"Reconocimiento de voz, generación de subtítulos, revisión de contenido"},{"title":"Precisión","desc":"Precisión","content":"Tasa de exactitud por palabra 98%"}],"datatag":"Portuguese,Casual Conversation,Monologue,Asr","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_12.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_12.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=mo76AesbDl2gicd7OyaN%2F7tGXjk%3D","intro":"Pelo Instituto Clay americano que convidou, é, várias sumidades matemáticas,","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_20.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_20.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=F5S3RB7tT%2B1NW6fwwUFpXF2UhGc%3D","intro":"Aée o, há uma confusão na imprensa, há um culto à celebridade que Perelman rejeita.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_28.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_28.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ed1fGL9ivoS94tU%2FxTs7wkFXBz8%3D","intro":"nos arredores de uma humilde cidade no interior do Paraná.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_24.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_24.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=IW3J7tCLsUVDRUgjEu4D4M%2BwPDM%3D","intro":"Eu acompanhei todo esse processo com grande perplexidade,","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_4.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230831004_demo1711101640948/100096_4.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=IbAAWPfhRNeQqhs8GrcHP2unU7Y%3D","intro":"E quem aqui, tendo ganhado o prêmio da Mega-Sena, se recusaria a receber o dinheiro? Levante a mão.","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Conjunto de datos de voz en portugués de Brasil, de carácter coloquial. Su contenido abarca áreas generales como contenidos de redes sociales, conversaciones y transmisiones en vivo, reflejando situaciones de interacción del mundo real. Este conjunto incluye anotaciones detalladas, como el contenido textual, la identidad y el género del hablante, entre otros atributos, garantizando alta precisión y facilidad de uso. Constituye un recurso valioso para la investigación y aplicaciones en reconocimiento de voz, y ha sido validado por varias empresas de AI: contribuye a que los modelos se desempeñen eficazmente ante la diversidad del entorno real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, asegurando que se proteja la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de los datos, todos los datos cumplen con GDPR, CCPA, PIPL.","dataexampl":null,"datakeyword":["Portugués brasileño"," Espontáneo"," Habla"," anotación texto"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1013 Hours - Brazilian Portuguese Spontaneous Speech Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
500 horas de datos de voz portugués brasileño_Coloquial
Portugués brasileño
Espontáneo
Habla
anotación texto
Conjunto de datos de voz en portugués de Brasil, de carácter coloquial. Su contenido abarca áreas generales como contenidos de redes sociales, conversaciones y transmisiones en vivo, reflejando situaciones de interacción del mundo real. Este conjunto incluye anotaciones detalladas, como el contenido textual, la identidad y el género del hablante, entre otros atributos, garantizando alta precisión y facilidad de uso. Constituye un recurso valioso para la investigación y aplicaciones en reconocimiento de voz, y ha sido validado por varias empresas de AI: contribuye a que los modelos se desempeñen eficazmente ante la diversidad del entorno real. Seguimos estrictamente las regulaciones de protección de datos y las normas de privacidad, asegurando que se proteja la privacidad y los derechos e intereses legítimos de los usuarios durante el proceso de recopilación, almacenamiento y uso de los datos, todos los datos cumplen con GDPR, CCPA, PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz 16 bit, wav, monoaural
Clasificación de contenido
Los contenidos abarcan una amplia gama de ámbitos, como variedades, entrevistas, diálogos y reseñas
Características de etiquetado
Segmentación y anotación de frases válidas, incluyendo puntos de inicio/fin, identificador de hablante y contenido textual
Idioma
Portugués brasileño
Código de idioma regional
pt-BR
País
Brasileño
Escenarios de aplicación
Reconocimiento de voz, generación de subtítulos, revisión de contenido
Precisión
Tasa de exactitud por palabra 98%
Ejemplo
Audio
Pelo Instituto Clay americano que convidou, é, várias sumidades matemáticas,
Audio
Aée o, há uma confusão na imprensa, há um culto à celebridade que Perelman rejeita.
Audio
nos arredores de uma humilde cidade no interior do Paraná.
Audio
Eu acompanhei todo esse processo com grande perplexidade,
Audio
E quem aqui, tendo ganhado o prêmio da Mega-Sena, se recusaria a receber o dinheiro? Levante a mão.