Projet 8 : Nuage de mots
Description du mini projet
Les nuages de mots sont apparus récemment pour représenter les mots-clés les plus importants sur une page, un ensemble de pages internet : Nuage de mots-clés.
En utilisant les connaissances acquises jusqu'à présent, vous allez écrire un programme qui permettra de construire tel nuage de mots à partir d'un fichier texte (au format .txt Plain Text UTF-8) téléchargé dans la bibliothèque du projet Gutemberg.
Cahier des charges
Pour cet exemple, on utilisera le roman de Jules Verne Cinq Semaines En Ballon ; il faut télécharger ce fichier texte et le placer dans le même répertoire que votre programme.
Ce programme devra proposer demander à l'utilisateur de saisir le nom du fichier texte à analyser :
Saisir le nom du fichier à analyser :
Le programme devra alors :
Transformer le fichier texte en une liste de mots
Extraire les 50 mots les plus importants et les afficher à l'écran
Pour déterminer l'importance des termes, les premiers essais pourront être faits en fonction de la fréquence de chaque mot bien que cette méthode a tendance à favoriser les petits mots.
On pourra ensuite utiliser des critères plus complexes comme celles suggérées sur la page Tag Cloud.
Complément : Palier 4 : Une fois le palier 3 franchi
Le rendu graphique peut être réalisé simplement à partir du langage HTML (voir l'exemple suivant) : votre programme devra donc créer un fichier HTML suivant le modèle donné en exemple.