Yann Esposito

Résumé

Je travaille dans le cadre de l'apprentissage automatique et plus précisemment sur l'inférence de modèles à états finis probabilistes et/ou pondérés à partir de séquences.

J'ai étudié plus précisément :

Les chaînes de Markov
Les automates probabilistes déterministes
Les modèles de Markov cachés (HMM), les automates probabilistes
Les automates à multiplicité

Actuellement, je m'intéresse à des modèles généralisant les automates à multiplicité :

Les automates d'arbres pondérés
Les transducteurs pondérés
Les machines à états finies pondérées à n bandes

Je m'intéresse également à l'utilisation des automates à multiplicité dans la reconnaissance d'images, de sons ou de séquences temporelles. En particulier, je me focalise actuellement sur l'utilisation de distances d'éditions qui semble être un outil naturel pour avoir un système de mesures entre données structurées.

Algorithmes

SEDiL

J'ai développé une plateforme logicielle d'apprentissage de distances d'éditions entre arbres ou séquences en JAVA (1.5) en utilisant Swing pour l'interface graphique. Cette plateforme se nomme SEDiL et a été développée pendant mon post-doctorat financé dans le cadre du projet marmota. J'ai travaillé avec Marc Sebban à la création de cette plateforme.

DEES

J'ai implémenté un algorithme d'inférence d'automates à multiplicité en C++ (DEES). Nous avons démontrer avec François Denis et Amaury Habrard que cet algorithme possède des propriétés théoriques d'apprentissage automatique intéressantes (voir l'article [COLT'06] ou [CAp'06]) telles que :

faible taille des modèles, réduisant ainsi le nombre de paramètres à évaluer ;
si la cible est une série rationnelle stochastique (en particulier les HMM en sont), alors l'algorithme l'identifie à la limite avec probabilité 1

Ces résultats positifs d'apprentissage sont d'autant plus étonnants que la classe identifiée à la limite par cet algorithme n'est pas récursivement énumérable !

Une étude ([ICGI'06]) montre que cet algorithme a un comportement pratique très intéressant. En effet, il tient ses promesses théoriques en ce qui concerne la taille et la qualité des modèles.

Principaux résultats théoriques

Pour simplifier j'écrirai MA (resp. PA, PDA) pour signifier Automate à multiplicité (resp. Automate probabiliste, Automate probabiliste déterministe).

Apprentissage automatique

Création d'un algorithme nommé DEES qui identifie à la limite avec probabilité 1 l'ensemble des séries rationnelles stochastiques.

Lorsque que l'on contraint DEES a engendrer des PA, il se restreint à engendrer des PRA. De plus la classe des distributions engendrables par des PRA est identifiée à la limite avec probabilité 1.

Les HMM et donc les PA sont identifiables à la limites avec probabilité 1, mais la preuve utilise un algorithme inutilisable en pratique.

Théorie des langages

Dans Probabilistic Automata d'Azaria Paz publié en 1977, plusieurs problèmes étaient restés ouverts :

Étant donné un MA à paramètres réels (positifs ou négatifs) :
- est-il décidable de savoir si il engendre une série rationnelle positive ?
- est-il décidable de savoir si il engendre une distribution de probabilité ?
L'ensemble des séries rationnelles engendrant une distribution de probabilité est-elle égale à l'ensemble des séries rationnelles engendrables par des automates probabilistes (MA à paramètres positifs) ?

La réponse à ces trois questions est négatives.

Introduction d'une classe intermédiare entre les PA et les PDA ; les Automates Probabilistes à états résiduels (PRA). Cette classe possède beaucoup de propriétés intéressantes.

Chaque classe d'automates (MA, PA, PRA et PDA) engendre des classes de distributions de probabilité différentes.

La classe des MA qui engendre des distributions de probabilités n'est pas récursivement énumérable.

Étude des opérateurs de réduction et de saturation des MA, PA, PRA et PDA.

Les HMM (Hidden Markov Model, chaînes de Markov Cachées) sont équivalents aux PA.

Applications

Ce travail est particulièrement adapté pour les applications où les données sont naturellement séquentielles. En particulier :

Bio-informatique (séquences de nucléotides ou d'acides aminés)
Traitement des vidéos (séquences d'images)
Reconnaissance manuscrite (séqucence temporelle de positions)
Traitement du langage naturel (séquence de mots)

Recherche

Intérets