Flowsquare+最適マシン製作4(最終回)


少し間が空いてしまいましたが、前回組み立てたRyzen 9 3900Xマシンを使って、実際にFlowsquare+の計算速度を計測します。

その前に、メモリのオーバークロック(OC)の設定を行います。これにより、IO負荷の比較的高いFlowsquare+の実行速度向上を期待できます。ただし、OC等の設定は、熱等の問題により強制終了や故障のリスクがありますので、各自の責任において実施してください。

今回用いたマザーボード(ASUS TUF GAMING X570-PLUS)の場合、Ai TweakerのタブからOC設定を簡単に行えるようになっています。以下にデフォルトの設定画面を示します。

デフォルトの Ai Tweaker設定画面

本マザーボードでは、Ai Overclock TunerをD.O.C.P.(Direct Over Clock Profile)に変更し、必要に応じて、D.O.C.P.をDDR4-3600に変更するのみで、3600HzのOC設定が可能です。何Hzにするかは、使用するメモリとCPUの仕様によります。変更すると、Ai Tweakerは以下のようになります。

D.O.C.P.変更後の Ai Tweaker設定画面

今回、Flowsquare+計算スピードを計測するにあたり、3つの機材(OC設定)を用いました。最初は、ここ2年ほどFlowsquare+開発に用いている①Dell XPS15(9560)です。2つ目は、上記OCを施していない、デフォルトの②Ryzen 9 3900X、最後はOCを施した③Ryzen 9 3900X(DDR4-3600)です。また、実施に用いたFlowsquare+のバージョンは、2019R3.1です。

ベンチマーク用のテストケースとして、公式サイトにて公開されているF1のシミュレーションを用いました。すべての入力ファイルは、Webサイトからダウンロード可能です。

様々な並列数における1ステップ当たりの計算時間

上に示す図は、横軸に並列数、縦軸に1ステップ当たりの計算時間で①②③をプロットした結果です。また、下図は、縦軸を並列無しの場合に対して計算速度向上率を各②③に対してプロットした結果です。どちらのプロットでも、12並列程度で計算速度向上が見られなくなり、並列効率も大きく低下していることが分かります。また、メモリのオーバークロックにより、計算速度向上率が最大で15%程度向上しています。

様々な並列数における計算速度向上率

一般的なPCでは、4並列又は8並列程度が最大となりますが、今後はメニーコア型のCPUが増えてくると予想され、Flowsquare+の次期アップデートでも、シリアル(並列無し)から、より並列性能に重きを置いた計算カーネルの変更を予定しています。


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA