jhj0517 / Whisper-WebUI

A Web UI for easy subtitle using whisper model.
Apache License 2.0
1.42k stars 200 forks source link

Gradio 디폴트값 변경 #252

Closed SeongGyu1216 closed 2 months ago

SeongGyu1216 commented 2 months ago

Gradio 사이트의 디폴트 설정값들을 변경할 수 있을까요? Model, 언어, 이름뒤에 날짜시간 활성화 등등이요 매번 실행할때마다 변경해줘야하는데 따로 설정할 수 있는곳을 못 찾겠습니다.

jhj0517 commented 2 months ago

안녕하세요 @SeongGyu1216 님.

250, #42 에서 같은 문제를 다룰 예정입니다!

jhj0517 commented 2 months ago

@SeongGyu1216 #255 에서 여러 변수들에 대한 로드 & 캐싱 기능이 업데이트 되었습니다.

default_parameters.yaml 에서 기본 설정 값들을 수정할 수 있으며, 마지막으로 사용한 값들이 자동으로 해당 파일에 캐싱됩니다.

혹시 문제가 생긴다면 언제든지 알려주시면 감사합니다!

SeongGyu1216 commented 2 months ago

알겠습니다! 감사합니다!!

혹시 update.bat파일을 실행할 때 Updating bf705a5..8bcf1fb HEAD is now at bf705a5 Merge pull request #247 from linuxlurak/master From https://github.com/jhj0517/Whisper-WebUI

이렇게 뜨더라구요 번역해보니 기존에 파일이있으니 합쳐질 수 있어서 먼저 제거하거나 이동하라고나오는데 자동으로 덮어씌우기하면서 업데이트되게할 수 있을까요?

SeongGyu1216 commented 2 months ago

안녕하세요 default 파라미터 파일의 값을 변경해도 적용이 안되는 것 같아요

예를들어

whisper: model_size: "small.en" lang: "english"

이렇게 변경하고 저장한다음 start-webui.bat 실행했는데 화면에 표시되는건 기존 거 그대로 나오네요

jhj0517 commented 2 months ago

문제 없이 되어야 정상인데요, 밑의 설정으로 다시 테스트 해보시겠어요? (혹시 들여쓰기를 안 하셨다면 중요합니다)

whisper:
  model_size: "small.en"
  lang: "english"
  is_translate: false
  beam_size: 5
  log_prob_threshold: -1
  no_speech_threshold: 0.6
  best_of: 5
  patience: 1
  condition_on_previous_text: true
  prompt_reset_on_temperature: 0.5
  initial_prompt: null
  temperature: 0
  compression_ratio_threshold: 2.4
  chunk_length_s: 30
  batch_size: 24
  length_penalty: 1
  repetition_penalty: 1
  no_repeat_ngram_size: 0
  prefix: null
  suppress_blank: true
  suppress_tokens: "[-1]"
  max_initial_timestamp: 1
  word_timestamps: false
  prepend_punctuations: "\"'“¿([{-"
  append_punctuations: "\"'.。,,!!??::”)]}、"
  max_new_tokens: null
  chunk_length: null
  hallucination_silence_threshold: null
  hotwords: null
  language_detection_threshold: null
  language_detection_segments: 1
  add_timestamp: true

vad:
  vad_filter: false
  threshold: 0.5
  min_speech_duration_ms: 250
  max_speech_duration_s: 9999
  min_silence_duration_ms: 2000
  speech_pad_ms: 400

diarization:
  is_diarize: false
  hf_token: ""

translation:
  deepl:
    api_key: ""
    is_pro: false
    source_lang: "Automatic Detection"
    target_lang: "English"
  nllb:
    model_size: "facebook/nllb-200-1.3B"
    source_lang: null
    target_lang: null
    max_length: 200
  add_timestamp: true
SeongGyu1216 commented 2 months ago

https://github.com/user-attachments/assets/d079da88-7c1b-45b0-b663-e90bc745a3ce

jhj0517 commented 2 months ago

Please move or remove them before you merge. Aborting

아하.. 업데이트가 제대로 되지 않았군요.

WebUI 폴더 안에서 터미널을 열고 (.git 폴더가 있는 위치)

git reset --hard origin/master

를 실행해보시겠어요?

혹시 여전히 문제가 있다면, venvmodels 폴더 (제일 무거운 폴더) 를 어딘가에 백업해두신 이후 Whisper-WebUI-Portable.zip 를 다시 다운받아 세팅해보시길 바랍니다.

다만 이렇게 할 경우 다시 복원한 venv 폴더의 경로 명은 이전과 똑같아야 합니다.

SeongGyu1216 commented 2 months ago

어찌저찌 성공한 것 같습니다! 감사합니다 문제생기면 알려드릴게요!