VOICEVOX / voicevox_project

VOICEVOX内のプロジェクトを管理するリポジトリ
15 stars 3 forks source link

VOICEVOXにおける各ドメイン用語の定義書制作がしたい #27

Open y-chan opened 1 year ago

y-chan commented 1 year ago

内容

Pros 良くなる点

Cons 悪くなる点

実現方法

Hiroshiba commented 1 year ago

意味を決めておいたほうが良い用語の候補をあげてみます。

discordでの話はこのあたり

Hiroshiba commented 1 year ago

一番鬼門そうな「音声ライブラリ」について、「キャラクターの声が生成されるなにか」だと思うのですが、用語の歴史をいろいろ調べてみました。

== DTM ==
・「サウンドライブラリ」
・意味は「音源」、wavファイルの一覧
・いろんな楽器の音がある

== VOCALOID ==
・「歌声ライブラリ」
・波形合成ベースらしいので「音源」の意図が強そう
・たぶんキャラの声と一対一対応

== AquesTalk ==
・「音声合成ライブラリ」
・おそらく「動的ライブラリ」の意図が強そう
・たぶん複数の声が出せる

== UTAU ==
・ボカロと同じ「歌声ライブラリ」
・意図も対応もボカロと一緒そう

== VOICEROID ==
・「音声データベース」
・波形合成なのだとしたら「音源」の意図が近そう
・1キャラ内の複数の声と対応

== CeVIO ==
・「ソングボイス」「トークボイス」
・1キャラ内の複数の声と対応

== SynthV ==
・「歌声ライブラリ」「歌声データベース」両方ある
・「音源」の意図じゃない気がする
・1キャラ内の複数の声と対応

== Seiren Voice ==
・「音声ライブラリ」を提唱
・意図は「音声合成バイナリ」
・いまのとこキャラの声と一対一対応

== VOICEVOX ==
・Seiren Voiceと同じ「音声ライブラリ」
・元の意図は「動的ライブラリ」
・複数のキャラの声と対応

まとめるとこうかなと

VOICEVOXとして、もともとは動的ライブラリ(つまりコア)を意図してたのですが、最近はいろいろとコアに機能が増えてボカロ文脈での「ライブラリ」からだいぶ離れてきたので、良い機会ですし変えてもいいなと思っています。

エンジンとかモデルとかボイスとは異なる概念で、かつボカロ文脈や元のVOICEVOX文脈と大きく違わないものが良さそうに思いました。 こう・・・?

で、これらの定義からVOICEVOXエンジン、VOICEVOXコアを説明するとこうなりそうです。

コアは音声エンジンでもあり音声ライブラリにもなるのがややこしいですね・・・。

sevenc-nanashi commented 1 year ago

VOICEVOX/voicevox 上が良さそう...?

(少しIssueの本題とはそれますが) 開発者用の情報をまとめたポータルみたいなもの(voicevox.github.io/voicevox_dev_docsみたいな?)があるとこういうのに悩む必要もなく、C/Python/HTTP APIのドキュメントのリンクを張るのにも良い感じの場所になると思いました。

Hiroshiba commented 1 year ago

あ、まさしく開発者用の情報をこのリポジトリvoicevox_projectdocsにまとめてました。 voicevoxの方にあるのはエディタ用のドキュメントと、移すの大変なのでそのままにしているドキュメントです。 Githubのデフォルトのmarkdownレンダリングだとページングがイマイチなので、良い感じのポータルほしいですね。。