thuxugang / doudizhu

AI斗地主
184 stars 66 forks source link

CFR模型和监督学习模型没有开源吗? #9

Closed xmgfx closed 4 years ago

xmgfx commented 4 years ago

看新闻里写你们实现了”基于规则的AI,基于强化学习的AI,基于蒙特卡洛搜索的AI(Alphago的思路),基于CFR的AI(德州扑克的思路),以及基于模仿学习的AI“,代码里似乎只能看到前3种。 另外想问一下,这几种模型强弱有比较吗?

thuxugang commented 4 years ago

Hi,不太清楚你看的是哪个新闻,我们只实现了前三种,我们是2017年的DeepCamp,你可能看的是后面几届的吧。。。 这个repro,基于蒙特卡洛搜索的AI>基于强化学习的AI>基于规则的AI,可能是规则太弱了,我们时间不太够。。。