ScaLAPACKによる性能評価

「scf.EigenvalueSolver」として「Cluster」や「Band」を用いた大規模系の計算においては、ScaLAPACKによる加速が期待できます。 表 3 には、各種のベンチマーク計算の結果を示してあります(runtest、runtestL、runtestL2をScaLAPACKの有無で比較)。 runtestL2ではScaLAPACKを用いることで有意に計算速度が向上しており、数千原子を含むような大規模系においてはScaLAPACKの使用が推奨されます。 また、メモリ使用量についてもScaLAPACKを用いた方が少なくなります。 ScaLAPACKを使用したコンパイル方法については、「インストール」の章をご参照下さい。

表 3: ベンチマーク計算をruntest、runtestL、runtestL2をScaLAPACKの有無で実施した際の計算時間(秒)。 runtestは8 MPI プロセス、2 OpenMPスレッドで、 runtestLは132 MPI プロセス、2 OpenMPスレッドで、 runtestL2は264 MPI プロセス、2 OpenMPスレッドでの計算をCRAY-XC30にて行った。

  non-ScaLAPACK ScaLAPACK
  (sec.) (sec.)
runtest 135 137
runtestL 1684 1599
runtestL2 30138 19946



2017-03-07