2024年03月06日 / 最終更新日時 : 2024年03月06日 hpcworldNEWS 技術情報 N体問題アプリケーションのOpenACCとCUDAの実装: 性能と作業コストの比較 はじめに プロメテックの南です。 以前行われた「GPUプログ […]
2024年02月06日 / 最終更新日時 : 2024年02月06日 hpcworldNEWS 技術情報 プロセスに対するCPUコアの割当 はじめに 今回は細かい話で、以下の違いについての理解が必要で […]
2023年11月29日 / 最終更新日時 : 2023年11月29日 hpcworldNEWS 技術情報 [cuFFT] OpenACCとCUDAライブラリの連携 (とmanaged memoryを使うときの注意) はじめに 以前の投稿で、OpenACCとThrustライブラ […]
2023年10月13日 / 最終更新日時 : 2023年10月13日 hpcworldNEWS 技術情報 [Fortran] do concurrent を使ったGPU並列化 はじめに 以前、C++ parallel algorithm […]
2023年09月29日 / 最終更新日時 : 2023年09月29日 hpcworldNEWS 技術情報 [性能評価] GPUを用いたLAMMPS分子動力学シミュレーション はじめに プロメテック・ソフトウェアの三上です。HPCインフ […]
2023年08月28日 / 最終更新日時 : 2023年08月28日 hpcworldNEWS 技術情報 [cuSPARSE-GPUライブラリ]cuSPARSE を使用した 共役勾配法(CG)プログラム GPUライブラリ(cuBLAS, cuSPARSE)を利用して、連立一次方程式の代表的な解法である共役勾配法を実装しました。 cudaは使用せず、GPUへのデータ転送に OpenACC の data clause, host_data clauseのみを使用しました。 BLAS/MKLを利用したCPU 1コア実行とくらべて、GV100で20倍以上高速になりました(格子サイズが大きい場合)。 A100 GPUではGV100の2倍以上の性能が得られる場合もありました
2023年07月31日 / 最終更新日時 : 2023年07月31日 hpcworldNEWS 技術情報 [CuPy] Python + GPUでシミュレーションの高速化をより身近に はじめに 前回までに、OpenACCやC++17で規格化され […]
2023年06月30日 / 最終更新日時 : 2023年06月30日 hpcworldNEWS 技術情報 【アプリプロファイリングをしてみよう!】Nsight Computeの導入・使用方法 はじめに プロメテックの南です。 今回は、NVIDIA社が提 […]
2023年05月24日 / 最終更新日時 : 2023年05月24日 hpcworldNEWS 技術情報 [cuSOLVER]LAPACKライブラリを使ったアプリケーションのGPU高速化 LAPACKライブラリを使って連立方程式を解くプログラムをGPUライブラリを使って高速化してみました。2時間ほどの作業で1.6倍の性能向上ができました。今回、具体的なプログラムの例と実行結果を紹介します。
2023年05月09日 / 最終更新日時 : 2023年05月09日 hpcworldNEWS 技術情報 [C++] OpenACCとCUDA (Thrust library) を連携する OpenACCとThrust (CUDA) の連携をするための機能を紹介します。