SEDiL est une plateforme logicielle créée dans la lignée du projet d'ANR Marmota. Cette plateforme a pour but de rassembler un ensemble d'algorithmes autour des distances d'éditions sur données structurées (séquences et arbres principalement).
L'initiative de la création de cette plateforme revient à Marc Sebban . La création de cette plateforme était la raison principale de mon post-doctorat au sein du laboratoire Hubert Curien.
Les distances d'éditions sont utilisées dans de nombreux domaines. Que ce soit en bio-informatique, en image, son, mais aussi dans des systèmes de reconnaissances musicaux, WEB...
Cependant les distances d'édition utilisés en pratiques sont souvent fixées à la main. La plupart du temps, personne ne possède l'expertise nécessaire pour fixer les paramètres de ces distances d'éditions avec précision. C'est pourquoi il semble utile d'essayer d'apprendre ces paramètres.
Parce que le format XML s'impose de plus en plus comme le nouveau format standard de données. De plus les arbres sont une généralisation des séquences (chaînes de caractères). Ainsi être capable de calculer et d'apprendre des distances d'éditions sur des arbres XML c'est être capable de calculer et d'apprendre des distances sur des séquences.
C'est un moyen de comparer la distance d'une donnée structurée à une autre en mesurant le nombre de modifications (d'opérations d'édition) nécessaire pour passer d'une représentation à l'autre.