CFR模型和监督学习模型没有开源吗？

thuxugang / doudizhu

AI斗地主

184 stars 66 forks source link

Closed xmgfx closed 4 years ago

xmgfx commented 4 years ago

看新闻里写你们实现了”基于规则的AI，基于强化学习的AI，基于蒙特卡洛搜索的AI（Alphago的思路），基于CFR的AI（德州扑克的思路），以及基于模仿学习的AI“，代码里似乎只能看到前3种。另外想问一下，这几种模型强弱有比较吗？

thuxugang commented 4 years ago

Hi，不太清楚你看的是哪个新闻，我们只实现了前三种，我们是2017年的DeepCamp，你可能看的是后面几届的吧。。。这个repro，基于蒙特卡洛搜索的AI>基于强化学习的AI>基于规则的AI，可能是规则太弱了，我们时间不太够。。。