Expérience professionnelle
- 2007-2008 : Consultant Airfrance, Astek, Sophia Antipolis
- 2006-2007 : Post Doctorat au Laboratoire Hubert Curien, Saint-etienne
- 2004-2006 : ATER, Attaché Temporaire d'Enseignement et de Recherche
- 2001-2004 : Allocataire Moniteur (Étudiant ayant reçu une bourse ministérielle ainsi qu'une bourse permettant d'enseigner en faculté)
- 1999-2000 : Vacations
Formation
- 2004 : Doctorat en informatique au
LIF,
Université de Provence,
Marseille (France)
- 2001 : DEA d'informatique
- 2000 : Maîtrise d'informatique
- 1999 : Licence d'informatique
- 1998 : DEUG MIAS (Mathématiques)
- 1995 : BAC S option mathématiques
Activités de recherche
(détails)
Domaine
- Apprentissage automatique ;
- Fouille de données ;
- Inférence grammaticale
Objets étudiés
- Chaînes de Markov Cachées ;
- Automates à multiplicité ;
- Transducteurs pondérés ;
- Automates d'arbres pondérés ;
- Distances d'edition d'arbres
Principaux résultats théoriques
-
Algorithme d'inférence d'automates à multiplicité
qui identifie l'ensemble des langages stochastiques rationels à la
limite avec probabilité 1,
-
savoir si un MA engendre une
distribution de probabilité est indécidable (était ouvert depuis 1977),
-
Algorithme d'inférence d'une sous-classe
non déterministe des HMM qui identifie à la limite avec probabilité 1
Outils réalisés
SEDiL :
Programme destinées à apprendre des distances d'éditions entre
des arbres.
Érit en JAVA (librairie SWING) (11 000 lignes commentaires
javadoc compris) ;
principales fonctionnalités :
-
apprentissage de matrices de coûts
d'éditions,
-
calcul de distance d'édition entre
arbres ou séquences de caractères,
-
visualisation d'arbres ou de séquences,
-
classification en utilisant les K plus proches
voisins,
-
Génération d'échantillons de couples d'arbres,
DEES : Programme d'inférence d'automates à multiplicité
écrit en C++ (7 500 lignes, 10 000 avec les commentaires) ;
principales fonctionnalités :
-
Inférence d'automates à multiplicité,
-
Inférence d'automates probabilistes
résiduels (inférence de Chaînes de Markov cachées ;
apprentissage des paramètres et de la structure),
-
Inférence d'automates probabilistes déterministes,
-
Algorithme de Baum Welch
(Apprentissage des paramètres d'un
HMM à partir
d'un échantillon de séquences),
-
Exportation au format
GraphViz,
-
Génération d'échantillons à partir d'un MA,
- ...
Publications scientifiques (Détails)
Journaux internationaux
- [Pattern Recognition, 2004]
Journaux nationaux
Conférences internationales
- [ICGI 2006]
- [COLT 2006]
- [COLT 2004]
- [ICALP 2003]
- [ICGI 2002]
Conférences nationales
- [CAp'06]
- [CAp'04]
- [CAp'03]
Workshop
Rapport de thèse
- [Université de Provence 2004]
Compétences
Langages de programmation
Utilisés actuellement :
- Java,
- Python,
- C++,
- C,
- Objective-C,
- PHP,
- scripts bash,
- LaTeX, ConTeXt, Metapost
Maîtrisés :
WEB
- HTML,
- XHTML,
- CSS,
- SVG,
- PHP,
- MySQL,
- PostGreSQL
Réseaux
- Ethernet,
- TCP/IP,
- UDP,
- DHCP,
- DNS,
- tcpdump,
- ethereal,
- VPN
Sécurité
-
Cryptographie,
- PGP, GPG,
-
Réseaux Anonymes,
- Network security
Gestion de projet
API
- System V,
- POSIX,
- STL (C++),
- Cocoa (Mac OS X)
Outils
- Entreprise Miner (SAS),
- Weka,
- Quartz Composer
Méthodes d'apprentissage
-
Selection d'attributs,
-
Naïve Bayes,
-
Arbres de décisions,
-
K plus proches voisins (KPP),
-
Chaînes de Markov (bigrammes, trigrammes, ...),
-
Chaînes de Markov cachées (HMM),
-
Réseaux de neurones (Perceptron multicouches),
-
SVM,
-
Boosting
Divers
Projet réseaux
Économiseurs d'écrans