nafiserb / ESpinS

GNU General Public License v3.0
23 stars 7 forks source link

mpirun crash when supercell_size increse to a threshold #3

Closed jrhui closed 2 years ago

jrhui commented 2 years ago

I find that in my own system, when supercell_size = 24 24 16, the progarm crash in MPI mode, but it work find in serial mode. This problem would disapper if I decrease the size to 24 24 14.

jrhui commented 2 years ago

Another problem I also found relating the limitation of maxlen=700 in io.F90, which would cause problem in reading tems when the number of temperature are large. Maybe better to allocate memory dynamically.

nafiserb commented 2 years ago

Could you provide us your main input?

jrhui commented 2 years ago

This is my ru.mcin file

Begin Unit_Cell_Cart 5.24188000 0.00000000 0.00000000 -2.62094000 4.53960124 0.00000000 0.00000000 0.00000000 11.20129000 End Unit_Cell_Cart

Begin Atoms_Frac Ru 0.3333333 0.6666667 0.0000000 1.50 Ru 0.6666667 0.3333333 0.0000000 1.50 Ru 0.3333333 0.6666667 0.5000000 1.50 Ru 0.6666667 0.3333333 0.5000000 1.50 End Atoms_Frac

tem_start = 1 tem_end = 1000 tems_num = 120 !! tems_mode = man !! tems = 5.00 10.00 15.00 20.00

!! Pt = .True. !! Pt_steps_swap = 10

steps_warmup = 100000 steps_mc = 400000 steps_measure = 4

initial_sconfig = random mcarlo_mode = random

supercell_size = 24 24 14

Energy_write = .True.

Order_parameter = .True. Begin Order_Parameter_Axes_Frac Ru 0 0 1 Ru 0 0 -1 Ru 0 0 -1 Ru 0 0 1 End Order_Parameter_Axes_Frac

Hamiltonian

Ham_singleion = .True. Begin SingleIon_Axes_Frac Ru 0 0 1 -0.001213333 Ru 0 0 1 -0.001213333 Ru 0 0 1 -0.001213333 Ru 0 0 1 -0.001213333 End SingleIon_Axes_Frac

Begin Jij_parameters f1= 0.333333, 0.666667, 0.000000:f2= 0.666667, 0.333333, 0.000000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.000000:f2= 0.666667, 1.333333, 0.000000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.000000:f2= -0.333333, 0.333333, 0.000000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.000000:f2= 0.333333, 0.666667, 0.500000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.000000:f2= 0.333333, 0.666667, -0.500000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.000000:f2= 0.333333, 0.666667, 0.000000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.000000:f2= 1.333333, 0.666667, 0.000000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.000000:f2= 0.333333, -0.333333, 0.000000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.000000:f2= 0.666667, 0.333333, 0.500000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.000000:f2= 0.666667, 0.333333, -0.500000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.500000:f2= 0.666667, 0.333333, 0.500000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.500000:f2= 0.666667, 1.333333, 0.500000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.500000:f2= -0.333333, 0.333333, 0.500000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.500000:f2= 0.333333, 0.666667, 0.000000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 f1= 0.333333, 0.666667, 0.500000:f2= 0.333333, 0.666667, 1.000000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.500000:f2= 0.333333, 0.666667, 0.500000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.500000:f2= 1.333333, 0.666667, 0.500000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.500000:f2= 0.333333, -0.333333, 0.500000:jij= -0.08666667!:sh= 1!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.500000:f2= 0.666667, 0.333333, 0.000000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 f1= 0.666667, 0.333333, 0.500000:f2= 0.666667, 0.333333, 1.000000:jij= -0.000866667!:sh= 3!:t1= 1:t2= 1 End Jij_parameters

nafiserb commented 2 years ago

I could run with 4 CPUs on i7 with 32 G RAM. Could you tell me the number of CPUs and RAM size?

jrhui commented 2 years ago

120 cpus and 4Gb RAM/cpu, do you try with supercell_size=24 24 16?

nafiserb commented 2 years ago

Yes. I tired with 24x24x16. Could you try with more RAM or less cpus (for example 60 cpus)? Although I think the 4 Gb RAM/cpu should be enough for 24x24x16.

jrhui commented 2 years ago

It seems the problem disappear for no reason. Thanks.