This dataset was recorded by a 30-year-old male speaker with authentic pronunciation and a mature, steady vocal quality in a professional recording studio. The recorded texts cover all phonemes, and the annotators have a professional linguistic background, ensuring the data meets the research and development needs for voice synthesis.
Im lặng là cách tốt nhất để cho ai đó biết họ đã làm bạn bị tổn thương.
Ngươi còn biết chế thuốc sao
Thôi, chú không cần nói nữa. Anh chưa phải tàn phế mà không làm gì được.
Xin lỗi, tôi đã để anh phải chịu oan ức rồi!
People also searched for
Chinese American English Synthesis Corpus
This datasets contains 80 speakers, with a balanced gender ratio, approximately 1.5 hours of data per speaker.
Existing labeling stages: Pronunciation, Prosody
Ongoing labeling: Phoneme boundaries
Overview: Focuses on common/fundamental language, includes everyday dialogue in a natural style