2023年08月28日 / 最終更新日時 : 2023年08月28日 hpcworldNEWS サイト更新 技術コラム ー [cuSPARSE-GPUライブラリ]cuSPARSE を使用した 共役勾配法(CG)プログラム - 技術コラム [cuSPARSE-GPUライブラリ]cuSPARSE を使用した 共役勾配法(CG)プログラムが公開されました。 技術コラムはこちら 本内容は GPUプログラミング勉強会 の事例の抜粋です(次回9/8金)。
2023年08月28日 / 最終更新日時 : 2023年08月28日 hpcworldNEWS 技術情報 [cuSPARSE-GPUライブラリ]cuSPARSE を使用した 共役勾配法(CG)プログラム GPUライブラリ(cuBLAS, cuSPARSE)を利用して、連立一次方程式の代表的な解法である共役勾配法を実装しました。 cudaは使用せず、GPUへのデータ転送に OpenACC の data clause, host_data clauseのみを使用しました。 BLAS/MKLを利用したCPU 1コア実行とくらべて、GV100で20倍以上高速になりました(格子サイズが大きい場合)。 A100 GPUではGV100の2倍以上の性能が得られる場合もありました
2023年08月07日 / 最終更新日時 : 2023年08月07日 hpcworldNEWS 技術情報 NVIDIA HPC SDK Version 23.7リリース - CUDAコンピュートアーキテクチャsm89のサポートが追加されました。
2023年07月31日 / 最終更新日時 : 2023年07月31日 hpcworldNEWS 技術情報 技術コラム ー [CuPy] Python + GPUでシミュレーションの高速化をより身近に - Python + GPUを取り上げ、数値計算ライブラリであるNumPy/SciPy、その互換インターフェイスを提供するGPU実装のCuPyを用いたコードを紹介しています
2023年07月31日 / 最終更新日時 : 2023年07月31日 hpcworldNEWS 技術情報 [CuPy] Python + GPUでシミュレーションの高速化をより身近に はじめに 前回までに、OpenACCやC++17で規格化され […]
2023年06月30日 / 最終更新日時 : 2023年06月30日 hpcworldNEWS 技術情報 技術コラム ー 【アプリプロファイリングをしてみよう!】Nsight Computeの導入・使用方法 - Nsight Computeの導入・使用方法を紹介しています。
2023年06月30日 / 最終更新日時 : 2023年06月30日 hpcworldNEWS 技術情報 【アプリプロファイリングをしてみよう!】Nsight Computeの導入・使用方法 はじめに プロメテックの南です。 今回は、NVIDIA社が提 […]
2023年06月01日 / 最終更新日時 : 2023年06月01日 hpcworldNEWS 技術情報 NVIDIA HPC SDK Version 23.5リリース - OpenACCランタイムのメモリアロケーションを制御するための環境変数がサポートされました。
2023年05月24日 / 最終更新日時 : 2023年05月24日 hpcsupport 技術情報 技術コラム ー [cuSOLVER]LAPACKライブラリを使ったアプリケーションのGPU高速化 - cuSOLVERを利用したLU分解の事例を紹介しています。
2023年05月24日 / 最終更新日時 : 2023年05月24日 hpcworldNEWS 技術情報 [cuSOLVER]LAPACKライブラリを使ったアプリケーションのGPU高速化 LAPACKライブラリを使って連立方程式を解くプログラムをGPUライブラリを使って高速化してみました。2時間ほどの作業で1.6倍の性能向上ができました。今回、具体的なプログラムの例と実行結果を紹介します。