v-nhandt21 / ViMFA

Montreal Forced Aligner for Vietnamese
MIT License
7 stars 2 forks source link

Ý nghĩa những con số và cách lấy duration label #1

Open NDNM1408 opened 6 months ago

NDNM1408 commented 6 months ago

Mình đang muốn lấy duration label của các từ Tiếng Việt. Mình có chạy thử code infer của bạn thì thấy ở mỗi từ có 1 con số. Mình đang thắc mắc không biết ý nghĩa của những con số này là gì. Ngoài ra bạn có thể chỉ cho mình cách lấy duration label của mỗi từ được không?

v-nhandt21 commented 5 months ago

Ý bạn có phải về những con số cuối này không hén:

ây ɤ̆ j 1 ấy ɤ̆ j 5 ầy ɤ̆ j 2 ẩy ɤ̆ j 4

Nếu đúng thì nó là dấu của các word á bạn

thivux commented 4 months ago

@v-nhandt21 anh cho em hỏi nếu symbol số ở cuối là dấu thì khi align duration mình expect duration cho các symbol số này là gì ạ?

v-nhandt21 commented 4 months ago

@v-nhandt21 anh cho em hỏi nếu symbol số ở cuối là dấu thì khi align duration mình expect duration cho các symbol số này là gì ạ?

Nếu với các model dạng như fastspeech2, mapping từng frame với phoneme thì các số/ dấu về ý tưởng nó không có duration á bạn, nhưng nó sẽ ảnh hưởng tới thông số các phone khác, mình nghĩ thế.

Một giải pháp nữa là bạn có thể ghép các tone này vào chung nguyên âm luôn, kiểu như:

bận -> b ɤ̆ n 6 -> b ɤ̆6 n

thivux commented 4 months ago

@v-nhandt21 em hiểu rồi ạ, thanks anh