Aspirer un site Web


Aspirer un site Web

Pour rédiger un rapport ou bien pour compléter un dossier, vous avez
besoin d'informations provenant de pages sur Internet. Or, à moins de
disposer en permanence d'une connexion à Internet, y compris en
déplacement, ou bien d'avoir pris le temps de récupérer les informations
qui vous sont nécessaires avant de bouger, vous n'aurez pas matière à
travailler.

La solution : copier sur son ordinateur les pages ou les sites Web qui
vous intéressent pour les emporter avec vous et pouvoir ainsi les
consulter hors connexion. Cela vous permettra également de conserver
une copie sur votre ordinateur de pages intéressantes
, qui peuvent
très bien changer ou disparaître sur Internet.

Les aspirateurs de sites Web sortis en même temps que la démocratisation
d'Internet, pour pouvoir télécharger un site en bas débit et le
consulter librement ensuite, sont toujours d'actualité. Avec eux, il est
possible de demander le téléchargement de l'intégralité d'un site,
ou seulement d'un certain nombre de niveaux de profondeur des pages
dans l'arborescence, de filtrer les éléments à ramener : pages,
images, animations, vidéo, musique, et même de limiter le poids total du
site en fixant un seuil à ne pas dépasser. Des fonctionnalités que l'on
retrouve dans HTTrack, un logiciel gratuit.

Et pour ne pas avoir à rapatrier l'intégralité des pages lors d'une mise
à jour d'un site que vous avez aspiré, seules les pages modifiées
sont téléchargées
.

Il vous restera alors plus qu'à copier les fichiers sur votre ordinateur
portable ou sur une clé USB pour pouvoir naviguer en déplacement sur
les pages que vous avez téléchargées, comme si vous étiez connecté.

Installer HTTrack

HTTrack est un aspirateur de sites Web complet et gratuit.

  1. Rendez-vous sur la
    fiche de HTTrack dans la logithèque
    .

  2. Cliquez sur le lien Télécharger gratuitement.

Démarrer une capture de site

Lancez HTTrack.

Paramétrer la capture

  1. Cliquez ensuite sur le bouton Définir les options.

  2. Ouvrez l'onglet Règles de filtrage.

  3. Cochez la case gif, jpg, png, tif et bmp pour
    télécharger les images des pages ramenées. Cochez les cases adéquates
    pour téléchargement aussi les musiques, animations, etc.

  4. Ouvrez ensuite l'onglet Limites.

  5. Vous pouvez maintenant définir le niveau de profondeur maximal
    que vous allez télécharger dans l'arborescence de la page que vous avez
    indiquée. Le niveau 1 correspond à la page d'accueil, 2
    à la page d'accueil et à tous les liens qu'elle contient, etc …
    Attention à ne pas mettre un niveau trop élevé (au dessus de 3 par
    exemple) car le nombre de pages téléchargées peut rapidement atteindre
    la dizaine de milliers sur un site bien fourni.

  6. Spécifiez également le niveau de téléchargement des liens qui
    pointent vers des pages extérieures au site d'origine, 1
    par exemple.

  7. Si vous êtes limité en taille, vous pouvez définir une taille
    maximale du site en octets, 100000000 pour 100 Mo par
    exemple.

  8. Déroulez la liste Taux maximal et choisissez l'option 50
    000
    pour augmenter la vitesse de téléchargement des pages et
    images.

  9. Ouvrez ensuite l'onglet Liens. Cochez la case Téléchargement
    les HTML en premier
    . Toutes les pages Web seront ainsi téléchargées
    avant les images.

  10. Cliquez enfin sur le bouton OK. Cliquez sur
    Suivant puis sur Terminer.

  11. La capture commence alors. Attention, l'opération peut être
    assez longue : tous les liens sont analysés, les images et pages
    téléchargées et l'architecture du site recréée sur votre disque dur.

Naviguer sur le site hors connexion

Toutes les pages et images du site aspiré (dans la limite du niveau que
vous avez défini) se trouvent sur votre ordinateur. Vous pouvez
consulter quand vous le souhaitez ces pages, les copier sur une clé USB
pour les emporter avec vous, etc.

Mettre à jour une capture

Si les pages du site que vous avez aspiré ont été mises à jour, pas
besoin de tout ramener. Vous pouvez télécharger uniquement les pages qui
ont été modifiées.

Étiquettes : , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s


%d blogueurs aiment cette page :