phonemizer

#1
by khangnguyen2 - opened

hello ông. Ông xóa đi một số phần của style tts gốc rồi đúng không? cụ thể là ông không cần dùng phonemizer mà encoder trực tiếp à. Tôi không tìm thấy phần phonemizer á. Cảm ơn ông

Vẫn dùng phonemizer á ông, ở đây nè. Còn khi chuẩn bị data để train thì sẽ phải chuyển từ text sang phoneme trước. Giống như thế này.

à tại thấy trong github train không có phần đó hóa ra ông chuẩn bị data phonemizer trước. Cảm ơn nhé. Mà nếu tôi muốn không dùng phonemizer liệu có ổn không nhỉ.

Tức là không dùng phoneme đúng ko. Tôi nghĩ là được, ông sẽ cần extend số token lên toàn bộ bảng chữ cái tiếng việt bao gồm cả mấy chữ có dấu như "á, ẵ, ặ,...". Nếu ông ko train để nói cả tiếng Anh tức là không cần dùng tới phoneme luôn thì không cần extend, cứ thay thế các kí tự ở _letters_ipa bằng chữ cái tiếng việt, thiếu thì có thể extend thêm.

Ở _letters nó có các kí tự tiếng anh r nên mấy chữ cái thông dụng abcd với ABCD thì ko cần phải thêm nha

okela cảm ơn ô nhiều nha.

à ông bỏ đi phần dùng PL-BERT đúng không hay phần extend kia là thay cho PL-BERT vậy ạ. Tôi muốn thêm một ngôn ngữ nữa á.

Đúng r, t bỏ plbert. Cái phần extend kia là cho text encoder với text aligner, hai thằng này dễ extend hơn plbert. À nhưng mà ông sửa letters_ipa nhiều vậy thì cũng gần ngang train mới đấy. Có kết quả thì cho tui xem với nhé:)

okela cảm ơn ông nhiều nào có kq thì tôi sẽ gửi ông.

khangnguyen2 changed discussion status to closed
Your need to confirm your account before you can post a new comment.

Sign up or log in to comment