Closed t0d4 closed 1 year ago
使用するモデルの候補を調べる。
以下をまとめられるとレポート書くときに良さそう
TRLのGPT-2をチューニングするチュートリアルを読む感じでは、クエリにIMDBデータセット(映画レビューのデータセット)を使うならIMDBデータセットでファインチューニングされたGPT-2(この場合だとgpt2-imdb)を利用すると良いようなので、
ようなGPT-2ベースのモデルを使うのが理想。
最初のトライとして、
を使ってRLしてみる。
使用するモデルの候補を調べる。
以下をまとめられるとレポート書くときに良さそう
TRLのGPT-2をチューニングするチュートリアルを読む感じでは、クエリにIMDBデータセット(映画レビューのデータセット)を使うならIMDBデータセットでファインチューニングされたGPT-2(この場合だとgpt2-imdb)を利用すると良いようなので、
ようなGPT-2ベースのモデルを使うのが理想。