Pyannote-audioの実装がpythonで完了いたしました．

axinc-ai / ailia-models

The collection of pre-trained, state-of-the-art AI models for ailia SDK

2k stars 318 forks source link

Pyannote-audioの実装がpythonで完了いたしました． #1425

Closed iamkimam closed 6 months ago

iamkimam commented 6 months ago

main.pyを他のモデルに掲載されているのと同様にargparseを設定し，ailia.Netでもonnxruntimeでも使用可能に変更いたしました．

使用されているモジュールは全てpyannoteフォルダ内に存在し，torchからnumpyに全て変更しました． requirements.txtに使用しているモジュールを掲載しております．

dataフォルダ内には音声ファイルとそのファイルに対する答えとなるrttmファイルが２セットあります．

iamkimam commented 6 months ago

・指摘をくださった部分を全て修正いたしました．・結果として画像が出力されるように変更いたしました．・依存モジュールを最小限にするように変更いたしました

kyakuno commented 6 months ago

pyannoteがすでにインストールされている場合、そちらを読みにいってしまいそうなので、 pyannoteフォルダの名前をpyannote_audio_utilsに変更し、importを

from pyannote_audio_utils.audio.pipelines.speaker_diarization import SpeakerDiarization
from pyannote_audio_utils.core import Segment, Annotation
from pyannote_audio_utils.core.notebook import Notebook
from pyannote_audio_utils.database.util import load_rttm
from pyannote_audio_utils.metrics.diarization import DiarizationErrorRate

と

from pyannote_audio_utils

した方が良さそうです。

iamkimam commented 6 months ago

コメントありがとうございます．コメントしてくださった部分を修正いたしました． README.mdや，prototxt周りも完了いたしました．

kyakuno commented 6 months ago

実装、ありがとうございました！