Passer à la navigation principale Passer à la recherche Passer au contenu principal

Predicting GPU Kernel’s Performance on Upcoming Architectures

  • CEA/UVSQ/CNRS
  • Telecom Sudparis
  • Laboratoire en Informatique Haute Performance pour le Calcul et la Simulation

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

With the advent of heterogeneous systems that combine CPUs and GPUs, designing a supercomputer becomes more and more complex. The hardware characteristics of GPUs significantly impact the performance. Choosing the GPU that will maximize performance for a limited budget is tedious because it requires predicting the performance on a non-existing hardware platform. In this paper, we propose a new methodology for predicting the performance of kernels running on GPUs. This method analyzes the behavior of an application running on an existing platform, and projects its performance on another GPU based on the target hardware characteristics. The performance projection relies on a hierarchical roofline model as well as on a comparison of the kernel’s assembly instructions of both GPUs to estimate the operational intensity of the target GPU. We demonstrate the validity of our methodology on modern NVIDIA GPUs on several mini-applications. The experiments show that the performance is predicted with a mean absolute percentage error of 20.3 % for LULESH, 10.2 % for MiniMDock, and 5.9 % for Quicksilver.

langue originaleAnglais
titreEuro-Par 2024
Sous-titreParallel Processing - 30th European Conference on Parallel and Distributed Processing, Proceedings
rédacteurs en chefJesus Carretero, Javier Garcia-Blas, Sameer Shende, Ivona Brandic, Katzalin Olcoz, Martin Schreiber
EditeurSpringer Science and Business Media Deutschland GmbH
Pages77-90
Nombre de pages14
ISBN (imprimé)9783031695766
Les DOIs
étatPublié - 1 janv. 2024
Evénement30th International Conference on Parallel and Distributed Computing, Euro-Par 2024 - Madrid, Espagne
Durée: 26 août 202430 août 2024

Série de publications

NomLecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
Volume14801 LNCS
ISSN (imprimé)0302-9743
ISSN (Electronique)1611-3349

Une conférence

Une conférence30th International Conference on Parallel and Distributed Computing, Euro-Par 2024
Pays/TerritoireEspagne
La villeMadrid
période26/08/2430/08/24

Empreinte digitale

Examiner les sujets de recherche de « Predicting GPU Kernel’s Performance on Upcoming Architectures ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation