t-sakashita / rokko

Integrated Interface for libraries of eigenvalue decomposition
Boost Software License 1.0
10 stars 2 forks source link

ELPAで使用するブロックサイズとバンド幅 #249

Open t-sakashita opened 8 years ago

t-sakashita commented 8 years ago

ELPAでベンチマークをとる際に使用する、ブロックサイズをどうするか?

t-sakashita commented 8 years ago

ELPA2のソースコードelpa2.F90に次の記述がある。

   ! Choose bandwidth, must be a multiple of nblk, set to a value >= 32
   ! On older systems (IBM Bluegene/P, Intel Nehalem) a value of 32 was optimal.
   ! For Intel(R) Xeon(R) E5 v2 and v3, better use 64 instead of 32!
   ! For IBM Bluegene/Q this is not clear at the moment. We have to keep an eye
   ! on this and maybe allow a run-time optimization here

nblk = 1のとき、nbw=64となる。(上記で、Intel(R) Xeon(R) E5 v2 and v3で推奨されている)

   nbw = (63/nblk+1)*nblk
t-sakashita commented 8 years ago

しばらく、RokkoのScaLAPACK向けのデフォルトと同様のブロックサイズ(dim / nprow)を使用する。 だが、ScaLAPACKのサンプルは1x1を使用している。 http://www.netlib.org/scalapack/examples/sample_pdsyev_call.f 全てのソルバで、1x1を使用するのが良いか?