Closed KorRyu3 closed 5 months ago
Whisper-large-v3を使用し、クライアントから送られてくるbase64の音声データを解析し、文章として出力します。
Whisper-large-v3
パッケージを追加しているため、poetry installをしてからプログラムを動かしてください。
poetry install
ローカルで動かす際は、必ずffmpegをインストールしてから推論を始めてください。 でないと、STTでの推論ができません。
ffmpeg
また、動作確認をする際は、stt_model_download.pyを実行してください。どのディレクトリにいても動くはずです。
stt_model_download.py
概要
Whisper-large-v3
を使用し、クライアントから送られてくるbase64の音声データを解析し、文章として出力します。変更内容
動作確認方法
パッケージを追加しているため、
poetry install
をしてからプログラムを動かしてください。ローカルで動かす際は、必ず
ffmpeg
をインストールしてから推論を始めてください。 でないと、STTでの推論ができません。また、動作確認をする際は、
stt_model_download.py
を実行してください。どのディレクトリにいても動くはずです。関連Issue, PR
その他