Rewards without confidence

EdoardoPona / predicting-inductive-biases-RL

fork of https://openreview.net/forum?id=mNtmhaDkAr - extending for inductive bias in RL

1 stars 0 forks source link

Closed EdoardoPona closed 1 year ago

EdoardoPona commented 1 year ago

implement binary reward models for the sentiment task, as opposed to CE with correct class

EdoardoPona commented 1 year ago