Passer à la navigation principale Passer à la recherche Passer au contenu principal

High performance checksum computation for fault-tolerant MPI over infiniband

  • INRIA Institut National de Recherche en Informatique et en Automatique
  • CNRS SAMOVAR UMR 5157
  • University of Tokyo

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

With the increase of the number of nodes in clusters, the probability of failures and unusual events increases. In this paper, we present checksum mechanisms to detect data corruption. We study the impact of checksums on network communication performance and we propose a mechanism to amortize their cost on InfiniBand. We have implemented our mechanisms in the NewMadeleine communication library. Our evaluation shows that our mechanisms to ensure message integrity do not impact noticeably the application performance, which is an improvement over the state of the art MPI implementations.

langue originaleAnglais
titreRecent Advances in the Message Passing Interface - 19th European MPI Users' Group Meeting, EuroMPI 2012, Proceedings
Pages183-192
Nombre de pages10
Les DOIs
étatPublié - 24 oct. 2012
Modification externeOui
Evénement19th European MPI Users' Group Meeting on Recent Advances in the Message Passing Interface, EuroMPI 2012 - Vienna, Autriche
Durée: 23 sept. 201226 sept. 2012

Série de publications

NomLecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
Volume7490 LNCS
ISSN (imprimé)0302-9743
ISSN (Electronique)1611-3349

Une conférence

Une conférence19th European MPI Users' Group Meeting on Recent Advances in the Message Passing Interface, EuroMPI 2012
Pays/TerritoireAutriche
La villeVienna
période23/09/1226/09/12

Empreinte digitale

Examiner les sujets de recherche de « High performance checksum computation for fault-tolerant MPI over infiniband ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation