Switch roneneldan/TinyStories -> skeskinen/TinyStories-hf

Description

Change roneneldan/TinyStories -> skeskinen/TinyStories-hf in the tinystories config (including the test config).

Motivation and Context

roneneldan/TinyStories has a bug - each document is split over multiple lines and separated by an eos string. But the load_dataset has no accompanying script to handle this logic, so we end up with a document split over multiple dataset samples, and several samples that are simply eos tokens.

How Has This Been Tested?

None

Does this PR introduce a breaking change?

Yes. A run of tinystories will now give different results.

ApolloResearch / rib

Switch roneneldan/TinyStories -> skeskinen/TinyStories-hf #342

Switch roneneldan/TinyStories -> skeskinen/TinyStories-hf

Description

Motivation and Context

How Has This Been Tested?

Does this PR introduce a breaking change?