ADT109119 / WhisperGUI

A simple GUI for OpenAI Whisper made with tkinter
MIT License
126 stars 22 forks source link

WhisperGUI

pic

此專案是我用2個小時簡單製作的WhisperGUI+快速安裝包,可以讓我們在使用Whisper時快速操作,無須打指令,以及讓懶得手動裝一堆東西的人可以快速的使用(Python以及FFmpeg還是要自己裝)。

2023.03.30更新 日前有人回報無法抓到GPU的問題,目前推測可能跟CUDA Toolkit有關,若未安裝CUDA Toolkit的人,可嘗試先安裝Nvidia CUDA Toolkit。若已安裝卻還是無法顯示GPU,可嘗試調整Bat檔中的第22行,將安裝的Torch CUDA版本改為與電腦的CUDA Toolkit版本相同。

2023.08.12更新 目前我有測試打包這個專案成執行檔,不用跑setup.bat創虛擬環境,直接下載下來解壓縮,執行裡面的main.exe就可以執行了,大家可以到releases裡下載下來試試看。(打包版經測試無須手動安裝CUDA Toolkit)

OpenAI Whisper

專案用途

此專案的作用

在於方便大家可以快速設定好的Whisper執行環境

以及讓多數使用者

可以僅需透過此GUI介面操作使用

而無須打指令

功能

目前支援操作以下幾種Whisper的功能

  1. 選擇多個音檔
  2. 選擇輸出位置
  3. 選擇使用模型
  4. 選擇辨識語言
  5. 選擇使用裝置(CPU、指定顯卡)
  6. 將字幕翻為英文

畫面

操作示意 選擇檔案>選擇跑模型的裝置>執行完成

選模型 選裝置 執行完成

安裝

請先自行安裝Python 3.7以上版本,以及FFmpeg

以下將會引導你如何在你的電腦上執行此專案。

取得專案

git clone git@github.com/ADT109119/WhisperGUI.git

或是直接在GitHub頁面點Download ZIP

確認電腦已有Pyhton以及FFmpeg

python --version
ffmpeg -version

執行setup.bat

請直接執行資料夾中的setup.bat,等待虛擬環境完成設置

執行專案

請直接執行資料夾中的run.bat,若無報錯,將可以看到GUI介面

資料夾說明

專案技術

聯絡作者

你可以透過以下方式與我聯絡

License

This project is under the MIT License. See LICENSE for further details.