YoujiaZhang / AlphaGo-Zero-Gobang

Meta-Zeta是一个基于强化学习的五子棋(Gobang)模型,主要用以了解AlphaGo Zero的运行原理的Demo,即神经网络是如何指导MCTS做出决策的,以及如何自我对弈学习。源码+教程
MIT License
71 stars 8 forks source link

Training & Performance Question and GPU requirement #6

Open jiwoongim opened 1 year ago

jiwoongim commented 1 year ago

Hi,

Thanks for sharing your implementation of AlphaGo Zero. I was wondering how long does it take to train AlphaGo-zero (RL based) on 9X9? And how long does it get? Could you share which GPUs did you train on?

Thanks

[Google translation version] "你好,

感谢分享您对 AlphaGo Zero 的实现。 我想知道在 9X9 上训练 AlphaGo-zero(基于 RL)需要多长时间?它需要多长时间? 你能分享一下你在哪些 GPU 上进行训练吗?

谢谢"

YoujiaZhang commented 1 year ago

这个代码还没有计算过时间的花费,只是进行了基本效果的实现

jiwoongim commented 1 year ago

我懂了。性能如何? 性能真的好吗?

YoujiaZhang commented 1 year ago

我记得他自己和自己下了两天吧 然后我就和他下,不注意的话 真的会输的

jiwoongim commented 1 year ago

你能分享一下你在哪些 GPU 上进行训练吗? 1080ti? 2080ti?