2023年06月30日 / 最終更新日時 : 2023年06月30日 hpcworldNEWS 技術情報 【アプリプロファイリングをしてみよう!】Nsight Computeの導入・使用方法 はじめに プロメテックの南です。 今回は、NVIDIA社が提 […]
2023年05月24日 / 最終更新日時 : 2023年05月24日 hpcworldNEWS 技術情報 [cuSOLVER]LAPACKライブラリを使ったアプリケーションのGPU高速化 LAPACKライブラリを使って連立方程式を解くプログラムをGPUライブラリを使って高速化してみました。2時間ほどの作業で1.6倍の性能向上ができました。今回、具体的なプログラムの例と実行結果を紹介します。
2023年05月09日 / 最終更新日時 : 2023年05月09日 hpcworldNEWS 技術情報 [C++] OpenACCとCUDA (Thrust library) を連携する OpenACCとThrust (CUDA) の連携をするための機能を紹介します。
2023年04月20日 / 最終更新日時 : 2023年04月21日 hpcworldNEWS 技術情報 [C++] 標準化された並列アルゴリズムを用いたCUDA GPUの利用 簡単に並列化できる手法としてC++17規格で標準化されたC++ Parallel Algorithmsを紹介します。
2022年11月07日 / 最終更新日時 : 2022年10月17日 hpcworldNEWS セミナー 最先端テクノロジーが集結!プロメテックグループ最大規模のカンファレンス PSC2022 プロメテックグループ最大規模のカンファレンスである「PSC 2022」を11/8(火)~11/10(木)開催いたします。 ▼公式サイト:詳細お申し込みはこちらから▼ https://www.prometech-sc.com/
2021年02月16日 / 最終更新日時 : 2021年02月25日 hpcsupport OpenACC + Unified memoryで開発をさらに簡単にする Unified memoryがどのような場合に使用できるかを解説しています。OpenACCとUnified memoryを組み合わせ明示的なデータコピーを省略することで、GPUアプリケーションの開発スピードをさらに上げることが可能です。
2021年02月03日 / 最終更新日時 : 2021年02月25日 hpcsupport OpenACCでGPU並列化を試してみる OpenACCのメリットとデメリットを理解していただくために、姫野ベンチマークのOpenACC化を試み、できる限り簡単に実装かつ必要十分な性能を得ることを目標としました。
2021年01月14日 / 最終更新日時 : 2021年02月25日 hpcsupport AWS P4dインスタンスを用いたNVIDIA A100のベンチマーク Amazon Web Services (AWS) にて提供が開始されたP4dインスタンスのベンチマークを通して、NVIDIA A100の性能評価を行いました。NVIDIA A100やAWS P4dインスタンスの利用検討のご参考にしていただければ幸いです。