Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
LINUX & OPEN SOURCE
3 mai 2009

TexLexAn 0.29 est disponible

J'ai mis sur sourceforge  http://sourceforge.net/projects/texlexan/   la version 0.29 de TexLexAn. 

Les principales améliorations sont:

- La choix du mode de résumé est fait à partir d'un l'historique. Le mode de résumé, le taux de compression, les caractéristiques du texte (nombre de mots, de phrases...) et du résumé (nombre de mot), sont sauvegardées dans un fichier. Ces caractéristiques servent ensuite à définir le mode de résumé et le taux de compression du nouveau texte. Le choix est basé simplement une recherche de similarité (minimisation des écarts). Les nouvelles caractéristiques de l'opération de résumé seront aussi sauvegardées à la fin du fichier historique. Donc le programme apprend de lui-même à choisir le meilleur mode pour résumer un texte.

-  La fonction de hachage de la phrase a été modifiée, elle code la phrase sur un entier de 8 octets (64 bits, de type long long int), et ne représente que le nombre de mots et le nombre de certaines lettres dans la phrase. Je présenterai l'avantage de cette fonction dans mon prochain message.

Publicité
Publicité
Commentaires
LINUX & OPEN SOURCE
Publicité
Archives
Publicité