Closed rild closed 7 years ago
TTS の部分のモデル
日常生活でたくさんのテキストを読まなきゃいけなくなって大変だから image - text - speech の統合システムを提案する
Once the NLP is complete, the voice database is searched and the speech units are selected that best fit together to produce the sounds associated with the given text.
several numeric units
numerical text-to-speech
何を言っているのかわからないぞ...
Griffin-Lim algorithm (GLA) の性能改善
ftp://cran.r-project.org/pub/R/web/packages/seewave/vignettes/seewave_analysis.pdf
これを受けて, python implement signal reconstruction from stft
とかググってみたら,
scipy.signal,stft/istft とかいうすごいモジュールにたどり着いた
どうもコード の History を見ると
signal.py 自体は 2012 年からあるモジュールだけれど, stft/istft は 2016-3-10 に追加された新しめのメソッド...?
http://mitp.nautil.us/article/170/last-words-computational-linguistics-and-deep-learning
Last Words: Computational Linguistics and Deep Learning A look at the importance of Natural Language Processing.
By Christopher D. Manning
誰が設計者であるのか