PGI blue

GPUでプログラムを高速化!

 PGI® コンパイラ は、NVIDIA 社のコンパイラ事業を行う、HPC とコンパイラ技術で長い経験を有する The Portland Group (PGI) の科学技術並びにエンジニアリング分野におけるフラグシップ・コンパイラです。ワールドクラスのマルチコア CPU パフォーマンスを提供するだけではなく、「OpenACC により簡単に GPU コンピューティング」 を実現します。x86 プロセッサだけでなく、OpenPOWER も加わり、主要な HPC プラットフォーム間でのパフォーマンスの移植性を提供します。

Learn more…

 GPUプログラミング法連載中!

OpenACC icon

ワールドクラスの CPU 性能と GPU 加速性

PGI Supports All Major HPC Platforms

 PGIコンパイラは、OpenACC および CUDA Fortran を使用して、CPU に必要なパフォーマンスを提供し、GPU アクセラレーション・システムでの HPC アプリケーション開発をサポートします。 OpenACC と CUDA プログラムは、デュアルソケットサーバのすべてのコアと比較して、単一の Tesla V100 GPU で数倍高速に動作し、MPI と OpenMP と相互運用することで、今日のマルチGPUサーバのフルパワーを実現します。

最新のCPUのサポート (SPEC CPU2017 FP Speed)

PGI SPEC CPU2017 FP Speed

 マルチコア CPU の性能は、PGI コンパイラの強みの一つとして、インテル Skylake、IBM POWER9、AMD Zen などの最新世代の HPC CPU をサポートしています。 PGI Fortran 2003、C11 および C++14 コンパイラは、最先端の SIMD ベクタライゼーションを提供し、Linux x86、Linux OpenPOWER、および macOS で新しく最適化された単精度および倍精度数値組み込み関数の恩恵を受けます。 さまざまな HPC 業界標準のベンチマークに関する PGI 2018のパフォーマンス結果のベンチマークのセクションを参照してください。

一つのソースコードで、パフォーマンスの移植性を実現できる!

CloverLeaf Performance Comparison

  Lagrangian-Eulerian の陽的な流体力学ミニアプリケーションである CloverLeaf は、英国の原子力兵器施設(AWE)で使用されるコードを代表する小型(4,500行)の軽量アプリケーションです。 OpenACC を使用すると、NVIDIA V100 GPU のパフォーマンスは、デュアルソケットの 40コア Intel Broadwell CPU よりも 7 倍以上高速で、bm32 データセットで完全に最適化されたコードを実行します。 MPI + OpenACC を使用して、4 x V100 で 15 倍以上の高速化が可能です。 OpenACC を使用して GPU に移植する際にソースコードを最適化すると、CPU コードのパフォーマンスが 50% 以上向上しました。

PGI Compiler は様々なプラットフォーム用基盤コンパイラへ!

PGI Supports All Major HPC Platforms

HPCシステムは、マルチコア x86 CPU から OpenPOWER、さらに、ARM、GPUアクセラレータに至るまで、急速に拡大しています。 PGI Fortran、C および C++コンパイラおよび OpenACC は、これらのすべてのプロセッサで高性能を実現するように設計されています。 マルチコア CPU または GPU のすべてのコアで OpenACC の並列化を含む、x86/OpenPOWER および GPU 用の PGI コンパイラが利用可能になりました。 NVIDIA Tesla GPU に結合された IBM POWER CPU 上 のPGI コンパイラも正式にリリースされております。 PGI と OpenACC は、今日必要なパフォーマンスと将来へ必要な柔軟性を提供します。 PGI コンパイラはあなたをそこに導くことができます。