[{"@type":"PropertyValue","name":"Formato","value":"48 kHz, 24 bit, wav, monoaural"},{"@type":"PropertyValue","name":"Entorno de grabación","value":"Entorno de estudio profesional"},{"@type":"PropertyValue","name":"Contenido de grabación","value":"Siete tipos de oraciones emocionales (alegría, ira, tristeza, sorpresa, miedo, disgusto, neutral) + oraciones con partículas modales"},{"@type":"PropertyValue","name":"Personal","value":"Doblador profesional; personaje: chica de 18 años, streamer de entretenimiento, aficiones: canto y baile"},{"@type":"PropertyValue","name":"Características de etiquetado","value":"Marcado fonético de palabras, marcado de rimas, marcado de límites de fonemas"},{"@type":"PropertyValue","name":"Equipo","value":"Equipos de grabación y software profesionales"},{"@type":"PropertyValue","name":"Escenarios de aplicación","value":"Síntesis de voz"},{"@type":"PropertyValue","name":"Volumen de datos","value":"Volumen de datos neutrales no inferior a 1.6 horas; volumen de datos con partículas modales no inferior a 0.4 horas; volumen de datos de otras seis emociones no inferior a 1.67 horas"}]
{"id":1304,"datatype":"1","titleimg":"https://es.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"219","type2str":null,"dataname":"12 horas de corpus de síntesis multi-emocional de voz femenina estilo presentador de entretenimiento chino","datazy":[{"title":"Formato","desc":"Formato","content":"48 kHz, 24 bit, wav, monoaural"},{"title":"Entorno de grabación","desc":"Entorno de grabación","content":"Entorno de estudio profesional"},{"title":"Contenido de grabación","desc":"Contenido de grabación","content":"Siete tipos de oraciones emocionales (alegría, ira, tristeza, sorpresa, miedo, disgusto, neutral) + oraciones con partículas modales"},{"title":"Personal","desc":"Personal","content":"Doblador profesional; personaje: chica de 18 años, streamer de entretenimiento, aficiones: canto y baile"},{"title":"Características de etiquetado","desc":"Características de etiquetado","content":"Marcado fonético de palabras, marcado de rimas, marcado de límites de fonemas"},{"title":"Equipo","desc":"Equipo","content":"Equipos de grabación y software profesionales"},{"title":"Escenarios de aplicación","desc":"Escenarios de aplicación","content":"Síntesis de voz"},{"title":"Volumen de datos","desc":"Volumen de datos","content":"Volumen de datos neutrales no inferior a 1.6 horas; volumen de datos con partículas modales no inferior a 0.4 horas; volumen de datos de otras seis emociones no inferior a 1.67 horas"}],"datatag":"Synthesis Corpus,TTS,Mandarin,Multi-emotional,Entertainment anchor","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/100003.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/100003.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=uMEV3TO532USz9MKnu1ZM3iK6YE%3D","intro":"希望#1能够#1呼吸#1新鲜#1空气#3而不是#1被污染#1物质#1包裹着#4。xi1 wang4 neng2 gou4 hu1 xi1 xin1 xian1 kong1 qi4 er2 bu2 shi4 bei4 wu1 ran3 wu4 zhi4 bao1 guo3 zhe5","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/000001.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/000001.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2FgwKxB3N2I4AIU0FgM5Ko82fZtQ%3D","intro":"请不要#1太过分#3,我是#1有#1边界的#4。qing3 bu2 yao4 tai4 guo4 fen4 wo3 shi4 you3 bian1 jie4 de5","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/500003.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/500003.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=cCOrRvHLWfeolbL%2BUQFVvKHKZkk%3D","intro":"我#1找不到#1任何#1颜色#1和#1乐趣#4。wo6 zhao3 bu2 dao4 ren4 he2 yan2 se4 he2 le4 qu4","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/300006.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/300006.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=GPokiHfh30zcglC2i72F2hqnahM%3D","intro":"跟着#1我的#1节奏#2一起#1舞动吧#4!gen1 zhe5 wo3 de5 jie2 zou4 yi4 qi6 wu3 dong4 ba5","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/200022.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230707001_demo1702029600667/APY230707001_demo/200022.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=XhXLYVcSHQNUPQhUYnnvhKef6Dk%3D","intro":"仿佛有#1一只手#3正从#1我的#1后背#1伸出来#4。fang3 fu2 you3 yi4 zhi1 shou3 zheng4 cong2 wo3 de5 hou4 bei4 shen1 chu1 lai5","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Biblioteca de síntesis multitemperamental estilo presentador de entretenimiento de 12 horas, grabada por locutores nativos de chino. Datos de siete emociones y partículas modales. Cobertura equilibrada de fonemas en el corpus, participación de fonetistas profesionales en la anotación, satisfaciendo con precisión las necesidades de investigación y desarrollo de la síntesis de voz.","dataexampl":null,"datakeyword":["Corpus síntesis"," TTS"," Mandarín"," Multi-emocional"," Presentador entretenimiento"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Voice Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechSyn","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"12 Hours - Chinese Mandarin Synthesis Corpus-Female, Entertainment anchor Style, Multi-emotional","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
12 horas de corpus de síntesis multi-emocional de voz femenina estilo presentador de entretenimiento chino
Corpus síntesis
TTS
Mandarín
Multi-emocional
Presentador entretenimiento
Biblioteca de síntesis multitemperamental estilo presentador de entretenimiento de 12 horas, grabada por locutores nativos de chino. Datos de siete emociones y partículas modales. Cobertura equilibrada de fonemas en el corpus, participación de fonetistas profesionales en la anotación, satisfaciendo con precisión las necesidades de investigación y desarrollo de la síntesis de voz.
Este Dataset es de pago para uso comercial, investigación y más. Los Datasets licenciados y listos para usar ayudan a impulsar proyectos de IA.
Especificaciones
Formato
48 kHz, 24 bit, wav, monoaural
Entorno de grabación
Entorno de estudio profesional
Contenido de grabación
Siete tipos de oraciones emocionales (alegría, ira, tristeza, sorpresa, miedo, disgusto, neutral) + oraciones con partículas modales
Personal
Doblador profesional; personaje: chica de 18 años, streamer de entretenimiento, aficiones: canto y baile
Características de etiquetado
Marcado fonético de palabras, marcado de rimas, marcado de límites de fonemas
Equipo
Equipos de grabación y software profesionales
Escenarios de aplicación
Síntesis de voz
Volumen de datos
Volumen de datos neutrales no inferior a 1.6 horas; volumen de datos con partículas modales no inferior a 0.4 horas; volumen de datos de otras seis emociones no inferior a 1.67 horas