axinc-ai / ailia-models

The collection of pre-trained, state-of-the-art AI models for ailia SDK
2k stars 318 forks source link

Pyannote-audioの実装がpythonで完了いたしました. #1425

Closed iamkimam closed 6 months ago

iamkimam commented 6 months ago

main.pyを他のモデルに掲載されているのと同様にargparseを設定し,ailia.Netでもonnxruntimeでも使用可能に変更いたしました.

使用されているモジュールは全てpyannoteフォルダ内に存在し,torchからnumpyに全て変更しました. requirements.txtに使用しているモジュールを掲載しております.

dataフォルダ内には音声ファイルとそのファイルに対する答えとなるrttmファイルが2セットあります.

iamkimam commented 6 months ago

・指摘をくださった部分を全て修正いたしました. ・結果として画像が出力されるように変更いたしました. ・依存モジュールを最小限にするように変更いたしました

kyakuno commented 6 months ago

pyannoteがすでにインストールされている場合、そちらを読みにいってしまいそうなので、 pyannoteフォルダの名前をpyannote_audio_utilsに変更し、importを

from pyannote_audio_utils.audio.pipelines.speaker_diarization import SpeakerDiarization
from pyannote_audio_utils.core import Segment, Annotation
from pyannote_audio_utils.core.notebook import Notebook
from pyannote_audio_utils.database.util import load_rttm
from pyannote_audio_utils.metrics.diarization import DiarizationErrorRate

from pyannote_audio_utils

した方が良さそうです。

iamkimam commented 6 months ago

コメントありがとうございます. コメントしてくださった部分を修正いたしました. README.mdや,prototxt周りも完了いたしました.

kyakuno commented 6 months ago

実装、ありがとうございました!