ratsgo / speechbook

articles about speech recognition
https://ratsgo.github.io/speechbook
Other
23 stars 1 forks source link

Introduction - ratsgo's speechbook #1

Open utterances-bot opened 4 years ago

utterances-bot commented 4 years ago

Introduction - ratsgo's speechbook

articles about speech recognition

http://ratsgo.github.io/speechbook/docs/introduction

hccho2 commented 4 years ago

사소한 오타:

음향 특징(Acoustic Feture)이 바로 MFCCs(Mel-Frequency Cepstral Coefficients)입니다 Feture --> Feature

DusanBaek commented 4 years ago

문의:

하지만 같은 음소나 단어라 하더라도 사람마다 발음하는 양상이 다릅니다. 화자가 남성이냐 여성이냐에 따라서도 음성 신호는 달라질 수 있습니다. 다시 말해 음성 신호의 다양한 변이형을 모두 커버하는 모델을 만들기가 쉽지 않다는 것입니다.

에서, P(X|Y) 또한 화자에 따라 다른 값이 도출되는건 동일한 것 아닌가합니다. P(Y|X)를 하기 어려운 한계는 X의 범위가 Y에 비해 현저히 크며, P(X|Y)의 경우에는 Y를 한정지을 수 있기 때문은 아닌지 싶네요

jooeun9199 commented 1 year ago

동감합니다. X의 분포를 모르기 때문에 P(Y|X)를 계산할 수 없으므로 계산할 수 있는 형태로 바꾼다 보는 게 맞는 것 같습니다.