| ■ PGI コンパイラ使用法に関するチュートリアル |
 |
並列化チュートリアル 連載(1) アムダールの法則、並列化率、並列効果
並列化する際に留意する事項、考え方、PGI コンパイラを利用して実際に並列化する方法(スレッド並列、MPI並列)、性能に関する考察等を順次、この並列化チュートリアルコーナーで連載していきます。 まず、初回は、並列性能に関する基本的な考え方の説明を行います。
|
 |
行列積のプログラムを例題に PGI コンパイラを使用する
行列積の計算を行うためのプログラムを例示し、PGI コンパイラの使用法、ACML ライブラリの使用法、行列積計算の性能等に関して説明します。
|
 |
高速フーリエ変換 FFTE パッケージを使う
最近、特に利用される方が多くなってきている、高速フーリエ変換ライブラリである FFTE に関して、 PGI コンパイラを使用して最適な性能を得るための方法について説明します。ここでは、特に、PGI
コンパイラ・ディレクティブ(指示行)の使用によって性能を向上させるための例を示します。
|
 |
行列積プログラムでメモリアクセス最適化
行列積のプログラムを用いて、最内側ループのメモリアクセス方法の変化により、性能が大きく異なることを説明します。行列積の性能最適化については他に多くの文献があり、メモリアクセス最適化の教科書的題材ですが、ここで理解していただきたいことは、プログラムの実効性能の大小は、実は配列計算時のメモリアクセスに関連したキャッシュの有効活用の度合いによって変化すると言うことです。
|
 |
メモリからのプリフェッチを制御し、キャッシュ利用の最適化を図る
PGI コンパイラ 6.0 以降では、コンパイラレベルでプリフェッチを行う対象を見出して、さらに、コンパイラ・オプションでキャッシュ制御命令のパラメータを指定することが可能で、プリフェッチのスケジューリング距離の調整やプリフェッチ命令の種類を変更することにより、キャッシュ利用の最適化を行うことができるようになりました。本稿では、プリフェッチ関連のコンパイラ・オプションの指定により、性能が大きく異なる場合があることを一つの例を使用して説明します。
|
| |
|