Passer à la navigation principale Passer à la recherche Passer au contenu principal

Testing probabilistic equivalence through reinforcement learning

  • Josée Desharnais
  • , François Laviolette
  • , Sami Zhioua
  • Rennes et Université Laval (Canada)

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

We propose a new approach to verification of probabilistic processes for which the model may not be available. We use a technique from Reinforcement Learning to approximate how far apart two processes are by solving a Markov Decision Process. If two processes are equivalent, the algorithm will return zero, otherwise it will provide a number and a test that witness the non equivalence. We suggest a new family of equivalences, called K-moment, for which it is possible to do so. The weakest, 1-moment equivalence, is trace-equivalence. The others are weaker than bisimulation but stronger than trace-equivalence.

langue originaleAnglais
titreFSTTCS 2006
Sous-titreFoundations of Software Technology and Theoretical Computer Science - 26th International Conference, Proceedings
rédacteurs en chef[initials] N. Arun-Kumar
EditeurSpringer Verlag
Pages236-247
Nombre de pages12
ISBN (imprimé)9783540499947
Les DOIs
étatPublié - 1 janv. 2006
Modification externeOui
Evénement26th International Conference on Foundations of Software Technology and Theoretical Computer Science, FSTTCS 2006 - Kolkata, Inde
Durée: 13 déc. 200615 déc. 2006

Série de publications

NomLecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
Volume4337 LNCS
ISSN (imprimé)0302-9743
ISSN (Electronique)1611-3349

Une conférence

Une conférence26th International Conference on Foundations of Software Technology and Theoretical Computer Science, FSTTCS 2006
Pays/TerritoireInde
La villeKolkata
période13/12/0615/12/06

Empreinte digitale

Examiner les sujets de recherche de « Testing probabilistic equivalence through reinforcement learning ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation