Documentation
- Mais, que fait-il donc ?
- À qui SmartBud s'adresse-t-il ?
- Fonctionnalités
- Fonctionnalités spécifiques
- Limitations de la version de démonstration
- Installation
- Paramétrage des extensions
- Options de sauvegarde
- Options de comptage de mots
- Options diverses
- Trucs et astuces
- Configuration minimale
- Crédits
- Licence, propriété intellectuelle
- Assistance
Mais, que fait-il donc ?
SmartBud est une application conçue dans le but d'aspirer à peu près tous les sites web HTML afin d'en créer une copie sur votre disque dur. Les liens des pages aspirées ne sont en aucun cas modifiés. SmartBud récupère des copies « propres » de sites web en vue de modification ou juste de stockage pour une consultation hors connexion.

À qui SmartBud s'adresse-t-il ?
Les traducteurs et agences de traduction verront un intérêt certain dans SmartBud en raison de sa fonctionnalité propre : établir un wordcount sur tout un site, en un seul clic.
Bien que l'application ait été développée pour des besoins propres à la traduction, les administrateurs de sites web trouveront aussi un intérêt certain dans cette application légère et gratuite.
Fonctionnalités
- Récupère les pages HTML ainsi que les images ;
- Établit un wordcount paramétrable pour chacune des pages d'un site ;
- Génère un rapport détaillé contenant le texte brut (nettoyé du HTML) des pages.
Fonctionnalités spécifiques
- Analyse du code Javascript afin de récupérer les « roll-overs » et les liens encapsulés ;
- Sélection automatique de la bonne page d'accueil ;
- Récupère aussi les e-mails contenus dans les sites aspirés.
Limitations de la version de démonstration
Ce logiciel est gratuit. La version de démonstration ne récupère que 20 liens sur chaque site.
Obtenez une licence facilement en cliquant ici pour vous enregistrer gratuitement.
Une fois le formulaire complété avec une adresse e-mail valide, vous recevrez immédiatement le mot de passe pour activer toutes les fonctionnalités du logiciel.
Votre enregistrement nous permet de savoir combien d'utilisateurs utilisent le programme. Aucune autre donnée n'est envoyée après activation de la clé. Vous ne recevrez pas de « pourriels » - les seuls courriers que vous pourrez recevoir concernent les annonces de mises à jour et les nouvelles versions de Smartbud. Merci de votre soutien !
Installation
Installez SmartBud dans le répertoire de votre choix, et lancez-le depuis le menu Démarrer une fois l'installation achevée. Le programme doit démarrer instantanément et lancer un pop-up vous informant des limitations de la version de démonstration.
Cliquez ici pour vous enregistrer
Avant de lancer la première aspiration, assurez-vous que votre connexion Internet fonctionne correctement.
Paramétrage des extensions des liens

Ici vous pouvez définir les types de liens que le programme devra suivre durant son aspiration.
Par défaut, le programme ne suit que les liens .htm et .html. Vous pouvez facilement ajouter de nouvelles extensions en cochant les cases correspondantes. En règle générale vous devrez cocher les liens .cgi, .php ou .asp pour aspirer la totalité d'un site.
Options de sauvegarde
Cette fenêtre vous permet de sélectionner le chemin et les fichiers utilisés pour les différents rapports.
Par défaut, le chemin principal se situe là où SmartBud a été installé (répertoire « data »).
Si vous cochez « Save files to disk », alors SmartBud copiera en temps réel les pages visitées dans le répertoire de votre disque dur préalablement sélectionné.
La case « Also save images » (activée par défaut) vous permet de sauvegarder ou non les images sur votre disque dur. Si vous décochez cette case alors vous n'aurez que les fichiers HTML sur votre disque dur.
Le fichier « report.txt » contient le journal d'aspiration du site. Vous y trouverez
les noms de fichiers, les wordcounts, la taille des images ainsi que le nombre
total de fichiers aspirés.
Vous pouvez désactiver la case « Save report » si vous ne souhaitez pas générer
de rapport.
Le fichier « dump.txt » contient tous les textes qui ont servi au wordcount de
chacune des pages HTML récupérées. Si vous devez comptabiliser les mots avec
une autre application, il vous suffit d'ouvrir le fichier « dump.txt » avec votre
application favorite.
L'option est par défaut désactivée.
Options de comptage de mots
Ici vous pouvez définir les parties devant entrer en ligne de compte dans le décompte de mots.
- ALT
comprend tous les textes de type « info-bulle » apparaissant sur les images, - META
comprend la description et les mots-clés, - VALUE
inclut tous les textes entre guillemets comme VALUE="text..." champs.
Vous pouvez également sélectionner un prix par mot source.
Options diverses
Cette option vous permet de récupérer les e-mails trouvés dans les pages HTML. Au cours de sa recherche, le programme recherche alors toutes les chaînes mailto:* champs.
C'est le nombre maximum de liens que vous souhaitez récupérer sur un seul et unique site web. La version de démonstration est limitée à 20 liens.
Si le site web que vous tentez d'aspirer est protégé par un mot de passe, alors
vous devrez saisir vos identifiant et mot de passe afin que SmartBud puisse
obtenir l'autorisation nécessaire pour la connnexion au site. Cette fonction
émule la protection par domaine ou .htaccess (realm protection) :
http://identifiant:motdepasse@www.monsite.com
Trucs et astuces
Avant de commencer l'aspiration de sites, prenez la peine de vous connecter
au site à aspirer afin de déterminer les extensions propres au site. Si par
exemple lors du survol d'un lien vous obtenez cette URL : http://www.monsite.com/default2.asp
…alors vous devrez activer la case « .asp » afin que SmartBud puisse suivre
ce type de liens.
Si vous n'êtes pas sûr du type de ces liens, cochez toutes les extensions !
Le programme détermine automatiquement la page de départ du site si vous saisissez le nom de domaine uniquement. Cela peut mener à quelques erreurs mineures. Veuillez noter cependant que le programme continue tout de même son aspiration même s'il n'a pas pu déterminer le nom exact de la page d'accueil.
Parfois SmartBud peut s'arrêter à la page d'accueil. Plusieurs raisons sont alors possibles :
- La page depuis laquelle vous désirez démarrer l'asxpiration redirige sur un autre domaine : connectez-vous manuellement sur le site (par le biais d'un navigateur) et copiez-collez l'URL résultante depuis la barre d'adresse après avoir passé la première page. Le nom de domaine doit être différent ;
- Cette page contient des URLs générées à la volée par un code JavaScript ne
pouvant être résolues par SmartBud.
Essayez toutefois de copier/coller l'URL suivante, cela peut fonctionner dans certains cas. - Le site a été conçu en Flash Macromedia©. Dans ce cas il n'y a rien à faire !
Configuration minimale
- Systèmes d'exploitation : Windows® 95, 98, ME, NT4, 2000 et XP ;
- Processeur : PC 133 Mhz ;
- Mémoire : 48 Mo ;
- Disque dur : 10 Mo d'espace disponible (pour le stockage des sites aspirés) ;
- Connexion Internet : 56 Kps ou plus.
Crédits
Cette application a été développée par Frédéric MICALLEF pour Atom e-City Ltd. Les outils suivants ont été utilisés :
- Perl 5.6 de Larry Wall ;
- Support Perl/TK (divers auteurs) ;
- Bibliothèques LWP par Gisle Aas ;
- Perl2exe par IndigoPerl®.
Remerciements à toutes ces personnes ainsi qu'à Fiona Busfield pour la relecture anglaise de cette documentation.
Licence, propriété intellectuelle
Ce programme est gratuit,cependant vous n'êtes pas autorisé à le revendre,
ni à le modifier.
Veuillez consulter le fichier de licence pour plus d'informations à ce propos.
Microsoft Windows®, Macromedia®, IndigoPerl® et Atom e-City Ltd.® sont des marques et noms d'enseignes déposés.
Assistance
Aucune assistance n'est disponible pour ce logiciel. Ni les auteurs, ni Atom e-City Ltd. ne sont responsables des dommages ou pertes résultant de l'utilisation de ce programme.