TexLexAn 0.29 est disponible
J'ai mis sur sourceforge http://sourceforge.net/projects/texlexan/ la version 0.29 de TexLexAn.
Les principales améliorations sont:
- La choix du mode de résumé est fait à partir d'un l'historique. Le mode de résumé, le taux de compression, les caractéristiques du texte (nombre de mots, de phrases...) et du résumé (nombre de mot), sont sauvegardées dans un fichier. Ces caractéristiques servent ensuite à définir le mode de résumé et le taux de compression du nouveau texte. Le choix est basé simplement une recherche de similarité (minimisation des écarts). Les nouvelles caractéristiques de l'opération de résumé seront aussi sauvegardées à la fin du fichier historique. Donc le programme apprend de lui-même à choisir le meilleur mode pour résumer un texte.
- La fonction de hachage de la phrase a été modifiée, elle code la phrase sur un entier de 8 octets (64 bits, de type long long int), et ne représente que le nombre de mots et le nombre de certaines lettres dans la phrase. Je présenterai l'avantage de cette fonction dans mon prochain message.