Open keisks opened 1 year ago
事前学習後にinstruction tuning を行う。(RLHFよりも効果が大きいという話を以前どこかで聞いた記憶がある。)
日本語で行う場合のデータをどうするか。また、evaluation用のデータ(タスク)とinstruction tuning用のデータ(タスク)は分ける必要がありそう。
https://huggingface.co/datasets/kunishou/databricks-dolly-15k-ja https://huggingface.co/datasets/kunishou/databricks-dolly-69k-ja-en-translation(翻訳タスク) これがオープンソースコミュニティの力?
RLFHについては https://huggingface.co/datasets/Anthropic/hh-rlhf を日本語化する必要がある。
https://ai.googleblog.com/2023/03/presto-multilingual-dataset-for-parsing.html?m=1
https://huggingface.co/datasets/MBZUAI/LaMini-instruction
事前学習後にinstruction tuning を行う。(RLHFよりも効果が大きいという話を以前どこかで聞いた記憶がある。)
日本語で行う場合のデータをどうするか。また、evaluation用のデータ(タスク)とinstruction tuning用のデータ(タスク)は分ける必要がありそう。