30 décembre 2009

Nouveau blog pour TexLexAn

Toutes les nouvelles concernant TexLexAn seront maintenant sur http://texlexan.blogspot.com/
Posté par InPhilly à 20:05 - - Commentaires [0] - Permalien [#]

29 novembre 2009

L'analyse des sentiments - TexLexAn 0.34

TexLexAn ( ver.  0.34 pour le moteur, vers. 0.30 pour l'interface graphique ) intègre désormé une analyse des sentiments. Le résultat est une valeur négative (insatisfaction) ou positive (satisfaction) générale qui est exprimé dans le texte analysé. Les phrases qui portent une valeur 'affective' sont extraites et retournées avec le résultat de l'analyse des sentiments. Le moteur d'analyse s'appuie sur une base de connaissance assistée par une analyse syntaxique simple de chaque phrase. Le programme ( pour linux, freebsd ) est... [Lire la suite]
Posté par InPhilly à 22:30 - - Commentaires [0] - Permalien [#]
06 juillet 2009

TexLexAn version 0.31

Cette nouvelle version de texlexan, v. 0.31 est disponible sur sourceforge. Elle permet à l'utilisateur de retourner un avis sur la qualité du résumé automatique. Ces avis influencent le programme sur le choix du mode de compression de texte, et consituent donc une forme d'apprentissage des plus rudimentaires (de type: juste ou faux).  Le programme est sur Source Forge: Pack1.38 Voiçi une copie d'écran sur la page de résultat (vous noterez en bas de l'écran qu'il est demandé à l'utilisateur de retourner une appréciation) :... [Lire la suite]
Posté par InPhilly à 05:18 - - Commentaires [0] - Permalien [#]
06 mai 2009

Open Source Summarizer for Linux TexLexAn 0.30

Le projet TexLexAn passe au stade alpha. La nouvelle version 0.30 du classifier-summarizer intégre un algorithme de sélection de la meilleure méthode d'extraction des phrases. L'algorithme est à la fois basé sur les expériences passées du summarizer et sur le score (pseudo-probabilité) de la classification du texte. Le code est disponible ici: https://sourceforge.net/projects/texlexan/    Une page web des plus simples est par là: http://texlexan.sourceforge.net/
Posté par InPhilly à 15:03 - - Commentaires [0] - Permalien [#]
03 mai 2009

TexLexAn 0.29 est disponible

J'ai mis sur sourceforge  http://sourceforge.net/projects/texlexan/   la version 0.29 de TexLexAn.  Les principales améliorations sont: - La choix du mode de résumé est fait à partir d'un l'historique. Le mode de résumé, le taux de compression, les caractéristiques du texte (nombre de mots, de phrases...) et du résumé (nombre de mot), sont sauvegardées dans un fichier. Ces caractéristiques servent ensuite à définir le mode de résumé et le taux de compression du nouveau texte. Le choix est basé simplement... [Lire la suite]
Posté par InPhilly à 15:14 - - Commentaires [0] - Permalien [#]
19 avril 2009

Comparaison ultra rapide floue de deux chaines / phrases

Une petite étude sans prétention: Une méthode de comparaison ultra rapide et floue de deux chaines. Les fonctions de la bibliothèque string.h : strcmp(s1,s2) et strncmp(s1,s2) permettent de comparer facilement deux chaines de caractères. L'inconvénient de strcmp() est d'être couteuse en temps de calcul, surtout si on ne cherche qu'à détecter une égalité ou non-égalité.  En outre strcmp n'est fait une comparaison "floue" de deux chaines. L'utilisation de la distance de Levenshtein permet une comparaison floue de... [Lire la suite]
Posté par InPhilly à 20:00 - - Commentaires [0] - Permalien [#]

11 avril 2009

Resumé automatique Open source et gratuit

La version 0.27 de TexLexAn qui est disponible sur sourceforge est capable de simplifier les phrases.  Dans une premières étapes, les phrases sont extraites du texte à résumer. (Méthode classique des résumés automatiques) La deuxième étape consiste à simplifier les phrases en remplaçant les expressions complexes par des expressions simplifiées. Par exemple: "une quantité suffisante"  est remplacé par "assez""de la même manière que"  => "comme""en aucun cas"... [Lire la suite]
Posté par InPhilly à 00:43 - - Commentaires [0] - Permalien [#]
30 mars 2009

Résumer les pages du web

Me voilà de retour avec une version de TexLexAn capable de résumer une page web en déposant simplement le lien (http://.....) depuis la fenêtre de l'explorateur.  Les fichiers pdf, ppt, doc et odt sont aussi reconnus à condition d'intaller les petits programmes suivant: pdftotext, ppthtml, antiword et odt2txt. L'excellent programme wget est nécessaire au  téléchargement des pages, ce dernier est normalement présent dans toute les distributions Linux. Si cela vous tente de l'essayer, le paquet est disponible sur... [Lire la suite]
Posté par InPhilly à 05:10 - - Commentaires [0] - Permalien [#]
16 février 2009

Codes sources

Les sources de TexLexAn sont placés dans sourceforge http://sourceforge.net/projects/texlexan/ , c'est plus pratique. La prochaine version ( 0.19 ) de texlexan va inclure un convertisseur html -> text, en outre plusieurs bugs ont été corrigés.  La nouvelle version sera disponible dans 2 jours dans sourceforge.
Posté par InPhilly à 20:22 - - Commentaires [0] - Permalien [#]
09 février 2009

Comparaison des résumés automatiques avec des résumés humains

Le discour d'Al Gore concernant les énergies renouvelables a été résumé par 6 logiciels différents et comparés à 3 résumés 'humains'. texte en entier Il est évident que les logiciels de résumés automatiques ne font qu'extraire les phrases jugées les plus significatives. L'extraction des phrases significatives se fait à partir des mots clés; aussi la principale différence entre les logiciels tient dans la manière dont sont choisis les mots clés. Résumés automatiques TexLexAn Algorithme 1: (169 mots)  ... [Lire la suite]
Posté par InPhilly à 03:26 - - Commentaires [1] - Permalien [#]