English . Français
- Style -
Bleu . Blob . LIF . Gris . Rouge!
Présentation ( Photo )
CV
Recherche
Enseignements
Logiciels
Divers sites perso

Recherche

Intérets

Thèmes de recherche
Publications (presentations)
Programmes (SEDiL)
Programmes (DEES)

Résumé

Je travaille dans le cadre de l'apprentissage automatique et plus précisemment sur l'inférence de modèles à états finis probabilistes et/ou pondérés à partir de séquences.

J'ai étudié plus précisément :

Actuellement, je m'intéresse à des modèles généralisant les automates à multiplicité :

Je m'intéresse également à l'utilisation des automates à multiplicité dans la reconnaissance d'images, de sons ou de séquences temporelles. En particulier, je me focalise actuellement sur l'utilisation de distances d'éditions qui semble être un outil naturel pour avoir un système de mesures entre données structurées.

Algorithmes

SEDiL

J'ai développé une plateforme logicielle d'apprentissage de distances d'éditions entre arbres ou séquences en JAVA (1.5) en utilisant Swing pour l'interface graphique. Cette plateforme se nomme SEDiL et a été développée pendant mon post-doctorat financé dans le cadre du projet marmota. J'ai travaillé avec Marc Sebban à la création de cette plateforme.

DEES

J'ai implémenté un algorithme d'inférence d'automates à multiplicité en C++ (DEES). Nous avons démontrer avec François Denis et Amaury Habrard que cet algorithme possède des propriétés théoriques d'apprentissage automatique intéressantes (voir l'article [COLT'06] ou [CAp'06]) telles que :

Ces résultats positifs d'apprentissage sont d'autant plus étonnants que la classe identifiée à la limite par cet algorithme n'est pas récursivement énumérable !

Une étude ([ICGI'06]) montre que cet algorithme a un comportement pratique très intéressant. En effet, il tient ses promesses théoriques en ce qui concerne la taille et la qualité des modèles.

Principaux résultats théoriques

Pour simplifier j'écrirai MA (resp. PA, PDA) pour signifier Automate à multiplicité (resp. Automate probabiliste, Automate probabiliste déterministe).
Apprentissage automatique

Création d'un algorithme nommé DEES qui identifie à la limite avec probabilité 1 l'ensemble des séries rationnelles stochastiques.

Lorsque que l'on contraint DEES a engendrer des PA, il se restreint à engendrer des PRA. De plus la classe des distributions engendrables par des PRA est identifiée à la limite avec probabilité 1.

Les HMM et donc les PA sont identifiables à la limites avec probabilité 1, mais la preuve utilise un algorithme inutilisable en pratique.

Théorie des langages

Dans Probabilistic Automata d'Azaria Paz publié en 1977, plusieurs problèmes étaient restés ouverts :

La réponse à ces trois questions est négatives.

Introduction d'une classe intermédiare entre les PA et les PDA ; les Automates Probabilistes à états résiduels (PRA). Cette classe possède beaucoup de propriétés intéressantes.

Chaque classe d'automates (MA, PA, PRA et PDA) engendre des classes de distributions de probabilité différentes.

La classe des MA qui engendre des distributions de probabilités n'est pas récursivement énumérable.

Étude des opérateurs de réduction et de saturation des MA, PA, PRA et PDA.

Les HMM (Hidden Markov Model, chaînes de Markov Cachées) sont équivalents aux PA.

Applications

Ce travail est particulièrement adapté pour les applications où les données sont naturellement séquentielles. En particulier :

Site entièrement réalisé avec Vim
Validation : [xhtml] . [css]