[{"@type":"PropertyValue","name":"Formato","value":"16 kHz, 16 bits, wav, mono"},{"@type":"PropertyValue","name":"Clasificación de contenido","value":"Diálogo, medios de comunicación personal, programas de variedades, etc."},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Bajo ruido"},{"@type":"PropertyValue","name":"Idioma","value":"Noruego"},{"@type":"PropertyValue","name":"Características de la anotación","value":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido"},{"@type":"PropertyValue","name":"Precisión","value":"Precisión de palabra 98% (las etiquetas, identificación de género, identificación del hablante y temas no se incluyen en el cálculo de precisión)"}]
{"id":1844,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"600 horas de datos de voz coloquial en noruego","datazy":[{"title":"Formato","desc":"Formato","content":"16 kHz, 16 bits, wav, mono"},{"title":"Clasificación de contenido","desc":"Clasificación de contenido","content":"Diálogo, medios de comunicación personal, programas de variedades, etc."},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Bajo ruido"},{"title":"Idioma","desc":"Idioma","content":"Noruego"},{"title":"Características de la anotación","desc":"Características de la anotación","content":"Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido"},{"title":"Precisión","desc":"Precisión","content":"Precisión de palabra 98% (las etiquetas, identificación de género, identificación del hablante y temas no se incluyen en el cálculo de precisión)"}],"datatag":"Norwegian,ASR,Casual Conversation","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"000001_3.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250807145947/000001_3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=%2FGuvCUxN5GJ1c1bJWNrh9hCg1aE%3D","intro":"Men du snakket jo om atte du, kanskje hadde lyst til liksom jobbe oppe i Kirkenes holdt jeg på å si.","size":141722,"progress":100,"type":"mp3"},{"name":"000001_6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250807145947/000001_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=uo1mp3PAP8thPhps5kLDky%2Bst3Y%3D","intro":"Fordi du får slettet studielån, du får ekstra lønn, bare du signerer kontrakten så får du mere penger, de betaler bo, reise, alt.","size":251802,"progress":100,"type":"mp3"},{"name":"000002_2.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250807145947/000002_2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=zZLmLM2PoBFJIOhwBu7rs38cMB8%3D","intro":"Og klokka er nå litt over ti. Eh, jeg våknet sånn halv åtte, tror jeg.[N]","size":170910,"progress":100,"type":"mp3"},{"name":"000002_7.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250807145947/000002_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=d8RjClg48FtvmZmqz4G4%2FdkMDGw%3D","intro":"T-skjorte fra Yoke, som jeg brukte på trening i dag, fordi. Ja jeg bestilte den opprinnelig for trening, slash vanlig. [N]","size":199248,"progress":100,"type":"mp3"}],"officialSummary":"Datos de voz coloquial en noruego, con contenido que cubre áreas generales como medios sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por múltiples rumanos de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.","dataexampl":null,"datakeyword":["conjunto de datos de voz en noruego"," datos de entrenamiento ASR para noruego"," corpus de conversación en noruego"," voz monólogo en noruego"," conjunto de datos de reconocimiento de voz en noruego"," datos de voz a texto en noruego"," conjunto de datos de voz en noruego"," datos de voz multilingües"," conjunto de datos de transcripción en noruego"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"600 Hours - Norwegian Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
conjunto de datos de reconocimiento de voz en noruego
datos de voz a texto en noruego
conjunto de datos de voz en noruego
datos de voz multilingües
conjunto de datos de transcripción en noruego
Datos de voz coloquial en noruego, con contenido que cubre áreas generales como medios sociales, diálogos, transmisiones en vivo, etc., reflejando situaciones de interacción del mundo real. Este conjunto de datos anota múltiples atributos como el contenido de texto, identidad y género del hablante, etc., grabados por múltiples rumanos de diferentes regiones y antecedentes culturales, con alta precisión y facilidad de uso, proporcionando recursos ricos para investigación y aplicaciones relacionadas con el reconocimiento de voz, y ayuda a que los modelos se desempeñen mejor frente a la diversidad del mundo real. Seguimos estrictamente las regulaciones de protección de datos y privacidad, garantizando la protección de la privacidad y los derechos legítimos de los usuarios durante la recolección, almacenamiento y uso de datos, y todos los datos cumplen con GDPR, CCPA y PIPL.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
16 kHz, 16 bits, wav, mono
Clasificación de contenido
Diálogo, medios de comunicación personal, programas de variedades, etc.
Entorno de grabación
Bajo ruido
Idioma
Noruego
Características de la anotación
Se anota el contenido del texto, marcas de tiempo por oración, identificación del hablante, género, anotación de ruido
Precisión
Precisión de palabra 98% (las etiquetas, identificación de género, identificación del hablante y temas no se incluyen en el cálculo de precisión)
Ejemplo
Audio
Men du snakket jo om atte du, kanskje hadde lyst til liksom jobbe oppe i Kirkenes holdt jeg på å si.
Audio
Fordi du får slettet studielån, du får ekstra lønn, bare du signerer kontrakten så får du mere penger, de betaler bo, reise, alt.
Audio
Og klokka er nå litt over ti. Eh, jeg våknet sånn halv åtte, tror jeg.[N]
Audio
T-skjorte fra Yoke, som jeg brukte på trening i dag, fordi. Ja jeg bestilte den opprinnelig for trening, slash vanlig. [N]