petitParseur !
Présentation

XML est un format de document très utile pour structurer l'information, pour la conserver et la transformer. Sa syntaxe est simple à appréhender et les fichiers concernés sont parfaitement lisibles, c'est du texte. Voilà pour aborder «rapidement» ce format, la suite est moins simple et on se retrouve vite confronté à deux difficultés de natures différentes mais qui se présentent dans le même temps à qui veut s'y exercer pour en voir les implications.
La première difficulté est un peu «extérieure» à l'informatique, elle porte sur la structuration d'un document : séparation de la forme du contenu, organisation de celui-ci, caractérisation de celle-là. C'est intéressant et pas si évident que cela en fin de compte.
La seconde difficulté, c'est la mise en oeuvre de XML : validation d'un document XML (vérification syntaxique, conformité à une DTD), transformation d'un document. Les outils existent, ils sont très performants mais la doc à lire pour leur utilisation est copieuse.
Après avoir utilisé deux de ces outils (le module Parser.pm en Perl et XT pour appliquer des feuilles de transformation XSL) et pour avancer plus vite sur des petits documents XML (petits en taille et ne faisant pas référence à plusieurs DTD) j'ai écrit le script petitParseur.pl en Perl. Mon intention est de disposer d'un module en Perl qui permet la transformation d'un document à la manière de XSL tout en conservant les possibilités d'interaction avec le système de Perl (calculs, insertion de fichiers, appels à d'autres modules, etc.)
Ce module me permet de gèrer des bases d'énoncés, de générer des albums photos, de définir ce site, de mêler dans un même document des informations à traiter par des applications différentes, de disposer de réalisations physiques distinctes d'un même document (pages HTML, document LaTeX/postcript/PDF), etc. C'est peu par rapport aux possibilités de XML mais cela progresse !
Enfin, et c'est le plus important, si dans cette démarche les outils posent quelques difficultés ou sont imparfaits, les documents restent et seront toujours exploitables (en l'état ou transformés vers une autre DTD), ouf !

Les productions

Présentations de courbes et exercices de reformulation (pour l'instant) sont accessibles à la page productions.

Les sources

Étant en train de redéfinir l'ensemble des scripts constituant l'application petitParseur, les sources ne sont pas accessibles pour l'instant.

Édition : Jean-Michel Sarlat
Mise à jour : 26 janvier 2008
(4615166) samedi 4 juillet 2009