kojimano / Megatron-DeepSpeed-ABCI

Other
5 stars 2 forks source link

instruction tuningについて #13

Open keisks opened 1 year ago

keisks commented 1 year ago

事前学習後にinstruction tuning を行う。(RLHFよりも効果が大きいという話を以前どこかで聞いた記憶がある。)

日本語で行う場合のデータをどうするか。また、evaluation用のデータ(タスク)とinstruction tuning用のデータ(タスク)は分ける必要がありそう。

keisks commented 1 year ago

https://huggingface.co/datasets/kunishou/databricks-dolly-15k-ja https://huggingface.co/datasets/kunishou/databricks-dolly-69k-ja-en-translation(翻訳タスク) これがオープンソースコミュニティの力?

keisks commented 1 year ago

RLFHについては https://huggingface.co/datasets/Anthropic/hh-rlhf を日本語化する必要がある。

keisks commented 1 year ago

https://ai.googleblog.com/2023/03/presto-multilingual-dataset-for-parsing.html?m=1

keisks commented 1 year ago

https://huggingface.co/datasets/MBZUAI/LaMini-instruction