This dataset was recorded by 14 speakers with authentic pronunciation and diverse vocal qualities (6 males and 8 females) in a professional recording studio. The recorded texts cover all phonemes, and the annotators have a professional linguistic background, ensuring the data meets the research and development needs for voice synthesis.
Ceceaba por presunción de guapeza; su andalucismo era más de cuarteles madrileños que de sevillanos bodegones.
El cliente sólo debe cumplimentar el cupón-respuesta sin asumir los costes de envío.
Para el capitán fue como ver partir a una jirafa en un pelotón de lobos coyotes y hienas.
Un guiado por ciudad deja la impronta de una circulación baja de vueltas sin percibir ahogos.
People also searched for
Chinese American English Synthesis Corpus
This datasets contains 80 speakers, with a balanced gender ratio, approximately 1.5 hours of data per speaker.
Existing labeling stages: Pronunciation, Prosody
Ongoing labeling: Phoneme boundaries
Overview: Focuses on common/fundamental language, includes everyday dialogue in a natural style