Hiroshiba / vv_core_inference

VOICEVOXのコア内で用いられているディープラーニングモデルの推論コード
MIT License
29 stars 5 forks source link

変更を1度だけにする #2

Closed Hiroshiba closed 2 years ago

Hiroshiba commented 2 years ago

ref

Hiroshiba commented 2 years ago

@Yosshi999 さん もしよければレビューをお願いできると嬉しいです!

Hiroshiba commented 2 years ago

レビュー感謝です!!

コンバート無しのpytorchモデルで生成した音声は特に異常なさそうだったので、おそらく推論時に副作用は無いと考えています。 あるとしたらonnxコンバートの部分で、変感時に何かしら冪等でない操作が行われてるのかなぁと。(onnxライブラリのバグとかで)

あ、変換回数で差が出るなら、1回変換したonnxモデルと2回変換したonnxモデルのweightとかを比較すれば特定できるかも…?

とりあえずマージします…!