Farama-Foundation / Minari

A standard format for offline reinforcement learning datasets, with popular reference datasets and related utilities
https://minari.farama.org
Other
266 stars 42 forks source link

[Proposal] MuJoCo Datasets #242

Open smorad opened 2 weeks ago

smorad commented 2 weeks ago

Proposal

Include the mujoco datasets from the d4rl package. Although https://github.com/Farama-Foundation/Minari/issues/79 suggests this is already implemented, it doesn't seem listed on the server

 minari list remote                                                                          
                                           Minari datasets in Farama server                                           
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━┓
┃ Name                              ┃ Versions ┃ Total Episodes ┃ Total Steps ┃ Dataset Size ┃ Author                ┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━╇━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━╇━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━┩
│ D4RL/antmaze/large-diverse-v1     │   v1, v0 │           1000 │     1000000 │ 605.2 MB     │ Alex Davey            │
│ D4RL/antmaze/large-play-v1        │   v1, v0 │           1000 │     1000000 │ 605.2 MB     │ Alex Davey            │
│ D4RL/antmaze/medium-diverse-v1    │   v1, v0 │           1000 │     1000000 │ 605.2 MB     │ Alex Davey            │
│ D4RL/antmaze/medium-play-v1       │   v1, v0 │           1000 │     1000000 │ 605.2 MB     │ Alex Davey            │
│ D4RL/antmaze/umaze-v1             │   v1, v0 │           1430 │     1000000 │ 605.0 MB     │ Alex Davey            │
│ D4RL/antmaze/umaze-diverse-v1     │   v1, v0 │           1430 │     1000000 │ 605.0 MB     │ Alex Davey            │
├───────────────────────────────────┼──────────┼────────────────┼─────────────┼──────────────┼───────────────────────┤
│ D4RL/door/cloned-v2               │       v2 │           4358 │     1000000 │ 532.3 MB     │ Rodrigo de Lazcano    │
│ D4RL/door/expert-v2               │       v2 │           5000 │     1000000 │ 543.3 MB     │ Rodrigo de Lazcano    │
│ D4RL/door/human-v2                │       v2 │             25 │        6729 │ 3.5 MB       │ Rodrigo de Lazcano    │
├───────────────────────────────────┼──────────┼────────────────┼─────────────┼──────────────┼───────────────────────┤
│ D4RL/hammer/cloned-v2             │       v2 │           3606 │     1000000 │ 564.5 MB     │ Rodrigo de Lazcano    │
│ D4RL/hammer/expert-v2             │       v2 │           5000 │     1000000 │ 584.4 MB     │ Rodrigo de Lazcano    │
│ D4RL/hammer/human-v2              │       v2 │             25 │       11310 │ 6.2 MB       │ Rodrigo de Lazcano    │
├───────────────────────────────────┼──────────┼────────────────┼─────────────┼──────────────┼───────────────────────┤
│ D4RL/kitchen/complete-v1          │       v1 │             19 │        4209 │ 4.3 MB       │ Rodrigo de Lazcano    │
│ D4RL/kitchen/mixed-v1             │       v1 │            621 │      156560 │ 157.5 MB     │ Rodrigo de Lazcano    │
│ D4RL/kitchen/partial-v1           │       v1 │            621 │      156560 │ 155.1 MB     │ Rodrigo de Lazcano    │
├───────────────────────────────────┼──────────┼────────────────┼─────────────┼──────────────┼───────────────────────┤
│ D4RL/minigrid/fourrooms-v0        │       v0 │            590 │       10010 │ 14.6 MB      │ Omar G. Younis        │
│ D4RL/minigrid/fourrooms-random-v0 │       v0 │          10174 │     1000070 │ 453.8 MB     │ Omar G. Younis        │
├───────────────────────────────────┼──────────┼────────────────┼─────────────┼──────────────┼───────────────────────┤
│ D4RL/pen/cloned-v2                │       v2 │           3736 │      500000 │ 313.6 MB     │ Rodrigo de Lazcano    │
│ D4RL/pen/expert-v2                │       v2 │           4958 │      499206 │ 338.3 MB     │ Rodrigo de Lazcano    │
│ D4RL/pen/human-v2                 │       v2 │             25 │        5000 │ 2.9 MB       │ Rodrigo de Lazcano    │
├───────────────────────────────────┼──────────┼────────────────┼─────────────┼──────────────┼───────────────────────┤
│ D4RL/pointmaze/large-v2           │   v2, v1 │           3360 │     1000000 │ 239.2 MB     │ Rodrigo Perez-Vicente │
│ D4RL/pointmaze/large-dense-v2     │   v2, v1 │           3360 │     1000000 │ 239.2 MB     │ Rodrigo Perez-Vicente │
│ D4RL/pointmaze/medium-v2          │   v2, v1 │           4752 │     1000000 │ 284.0 MB     │ Rodrigo Perez-Vicente │
│ D4RL/pointmaze/medium-dense-v2    │   v2, v1 │           4752 │     1000000 │ 284.0 MB     │ Rodrigo Perez-Vicente │
│ D4RL/pointmaze/open-v2            │   v2, v1 │           9525 │     1000000 │ 437.6 MB     │ Rodrigo Perez-Vicente │
│ D4RL/pointmaze/open-dense-v2      │   v2, v1 │           9525 │     1000000 │ 437.6 MB     │ Rodrigo Perez-Vicente │
│ D4RL/pointmaze/umaze-v2           │   v2, v1 │          13210 │     1000000 │ 556.2 MB     │ Rodrigo Perez-Vicente │
│ D4RL/pointmaze/umaze-dense-v2     │   v2, v1 │          13210 │     1000000 │ 556.2 MB     │ Rodrigo Perez-Vicente │
├───────────────────────────────────┼──────────┼────────────────┼─────────────┼──────────────┼───────────────────────┤
│ D4RL/relocate/cloned-v2           │       v2 │           3758 │     1000000 │ 527.7 MB     │ Rodrigo de Lazcano    │
│ D4RL/relocate/expert-v2           │       v2 │           5000 │     1000000 │ 552.2 MB     │ Rodrigo de Lazcano    │
│ D4RL/relocate/human-v2            │       v2 │             25 │        9942 │ 5.0 MB       │ Rodrigo de Lazcano    │
└───────────────────────────────────┴──────────┴────────────────┴─────────────┴──────────────┴───────────────────────┘

Motivation

These are probably the most-used environments, it would be nice if we could download such datasets through minari.

Pitch

minari list remote should list reacher, hopper, half-cheetah etc.

Checklist

younik commented 2 weeks ago

We are planning to add it as soon as Gymnasium 1.0 is out; which I believe will happen soon.

We have the expert policies, here you can find the script for generating them: https://github.com/Farama-Foundation/minari-dataset-generation-scripts/pull/8/files