Sequence - Githubissues

junxnone / Eureka

Official Repository for "Eureka: Human-Level Reward Design via Coding Large Language Models"

MIT License

0 stars 0 forks source link


sequenceDiagram
    participant Eureka
    participant GPT4 as LLMs GPT4
    participant Gym as Isaac Gym

    loop Interations: Get best reward
        loop Samples: Generate reward
        note over Eureka: Build Prompt
        Eureka->>GPT4: Query reward Sample code
        GPT4 -->> Eureka: Return Reward code
        end

        loop Samples: Training with generated reward
        note over Eureka: Build RL Envs
        Eureka ->> Gym: Training with reward code
        Gym -->> Eureka: Return Results
        end

        note over Eureka: Update the best reward
        note over Eureka: Rebuild Prompt
    end

    Eureka->> Gym: Evaluate with best reward
    note over Gym: Generate the last weights

junxnone / Eureka

Sequence #5