datawhalechina / DOPMC

Datawhale 开源项目管理委员会(Datawhale Open-source Project Management Committee,简称DOPMC)
200 stars 20 forks source link

robot-learning-algo #185

Open Evan-wyl opened 10 months ago

Evan-wyl commented 10 months ago

你是否已经阅读并同意《Datawhale开源项目指南》?

你是否已经阅读并同意《Datawhale开源项目行为准则》?

项目简介

旨在梳理模仿学习和离线强化学习的知识点、理论基础。先梳理模仿学习知识点,然后是离线强化学习。

立项理由

模仿学习、离线强化学习都没有现成的入门资料,对于初学者入门不友好,希望借此机会梳理相关知识,降低感兴趣者的入门门槛。

项目受众

  1. 在校大学生
  2. 感兴趣的同学
  3. 对机器人感兴趣的同学

项目亮点

  1. 对于该领域国内外均缺失相关教材。
  2. 系统梳理模仿学习知识点,形成全面的认识,有利于后续学习。

项目规划

章节: 模仿学习篇 第一章 模仿学习简介 第二章 行为克隆 第三章 主动模仿学习 第四章对抗式模仿学习 第五章环境模仿学习 第六章 总结

离线强化学习规划中...... 与组织内的easy-rl中算法不同的是,离线强化学习并不需要与环境交互,而是根据采集到的专家数据或非专家数据进行学习,其学习范式有本质的不同,其基础理论也有本质的不同,当下国内外没有相关的入门参考资料,因此需要梳理。

项目负责人

李万业 https://github.com/Evan-wyl/move-as-experts

备注:发起立项申请后DOPMC成员将会在7天内给出审核意见,若7天内无反对意见则默认立项通过~

GYHHAHA commented 10 months ago

easy-ros2arm好像也是负责人?不建议两个同时开

andongBlue commented 10 months ago

https://github.com/Evan-wyl/move-as-experts 这个网页的视频是你自己录的还是其他人的内容呢?我觉得以目前的资料为依据有点单薄。

Evan-wyl commented 10 months ago

easy-ros2arm好像也是负责人?不建议两个同时开 两个项目自己都在做,easy-ros2arm代码自己已经写了70%了,后续的文本资料希望找其它同学来写。

Evan-wyl commented 10 months ago

https://github.com/Evan-wyl/move-as-experts 这个网页的视频是你自己录的还是其他人的内容呢?我觉得以目前的资料为依据有点单薄。

视频不是我的,是业界大佬的,视频中也有相关论文,还有综述,不要只看我贴的视频,我还上传了电子书、论文等。 总结一下还是能形成一个小册子的。

Evan-wyl commented 10 months ago

电子书中内容较为单薄,且有很多地方讲的清楚,准备梳理一下知识点。

GYHHAHA commented 10 months ago

这个作者b站视频的网站里用的是No Derivatives的协议,使用相关材料整理是否获得作者许可?

Evan-wyl commented 10 months ago

本项目是以视频为引导,梳理知识

ZhikangNiu commented 9 months ago

建议在完成一个项目后开始此项目,或者提供一个初稿并取得作者的许可

Evan-wyl commented 9 months ago

建议在完成一个项目后开始此项目,或者提供一个初稿并取得作者的许可

该项目并不是完全照抄对应视频内容,是以视频为导引,梳理相关知识,类似于做文献综述 所以,是否需要作者许可有待再考虑 若是看了我现在已写内容,就会明白并不是完全照抄,而是综述。若是综述,那么个人认为不需要作者许可。

Evan-wyl commented 9 months ago

再解释一下,视频只是一条线索。按着线索,阅读论文,对模仿学习相关知识进行综述,梳理,形成一个体系。

Evan-wyl commented 9 months ago

并没有按照视频里面咋说,自己就咋写,而是把视频资料当作参考资料。 目前为止,自己写的内容,更多来自论文。

Evan-wyl commented 9 months ago

这个项目自己也没有打算完全由自己完成,精力有限。 若后期立项成功,自己打算找队友,一起进行综述。 easy-rosArm那个项目,也是需要找小伙伴一起做。

GYHHAHA commented 9 months ago

我举个第二章的例子,比如开头这里这三个公式是视频搬过来的,但是根据描述并没有把这个意义描述的比较清楚,比如红框的里几个符号的含义至少需要说明,这个补充的部分属于规划的还未完成的30%之内吗 12 12 2023_23 42 38_REC 12 12 2023_23 45 48_REC

ZhikangNiu commented 9 months ago

@Evan-wyl 我理解您的意思,我的看法主要有以下几点

  1. 我觉得可以先把精力放在一个项目上,因为一个项目的课程做完,还需要去收集人员内测,反馈,再迭代修改的一个过程。easy-rosArm是一个很好的项目,因此我建议您可以先找完小伙伴然后合着去修订easy-rosArm这个教程
  2. 内容我看了一下,我觉得你可以将此项目标记为help wanted,标记为招人,然后可以按照您的进度去修订这个教程,目前来看,内容还是较为稀少,因此我觉得可以先召集一部分的人得到一个初稿在进行进一步的完善。
  3. 总的来说,我们希望每一个课程的负责人都能将所有的精力放在一个教程上,产出一个比较完善的,优质的教程
Evan-wyl commented 9 months ago

我举个第二章的例子,比如开头这里这三个公式是视频搬过来的,但是根据描述并没有把这个意义描述的比较清楚,比如红框的里几个符号的含义至少需要说明,这个补充的部分属于规划的还未完成的30%之内吗 12 12 2023_23 42 38_REC 12 12 2023_23 45 48_REC

这些公式描述的确属于剩下的30%,还有第一章对有限回合制马尔科夫决策过程和无限马尔科夫决策过程,还有第二章的最大似然估计的推导。 目前自己的主要精力,是先把基本框架搭起来 自身已有强化学习的相关知识,所以自己熟悉的再写,对自己来说,的确有点不合适。当下更多关注的是自己不熟悉的且不理解,来搭建框架。 也因此需要伙伴一起做。

Evan-wyl commented 9 months ago

这两个项目自己的想法不是一个人完成一章节,而是大家一起完善项目。 若有伙伴认为那里写的不好,可以提proposal。 我先把框架搭起来,具体的完善,需要后期不断有伙伴参与。

GYHHAHA commented 9 months ago

好,easy-ros2arm看到暂缓了,那你先做这个吧

Evan-wyl commented 9 months ago

项目规划以仓库为主。