Internet vit de liens. En cliquant sur les liens, les utilisateurs se déplacent entre les pages des sites. En publiant des liens, l'attention est attirée sur des ressources intéressantes. Les liens sont utilisés par les moteurs de recherche pour reconstituer la base de recherche et calculer les paramètres utilisés dans le classement. Les liens sont l'épine dorsale du Web. C'est pourquoi une liaison correcte et une structure de liaison correcte sont si importantes pour chaque ressource. Et c'est pourquoi chaque webmaster devrait connaître la réponse à la question de savoir comment extraire tous les liens d'un site, d'une page individuelle ou d'un groupe de pages.
Il est nécessaire
- - le programme gratuit Xenu's Link Sleuth, téléchargeable sur
- - Connexion Internet.
Instructions
Étape 1
Créez un nouveau projet dans Xenu's Link Sleuth. Dans le menu principal de l'application, sélectionnez l'élément "Fichier" puis "Vérifier l'URL …", ou appuyez sur le raccourci clavier Ctrl + N. Dans la boîte de dialogue « Point de départ de Xenu » qui apparaît, dans le champ du haut, entrez l'URL de la page à partir de laquelle vous souhaitez commencer à extraire les liens. Si nécessaire, remplissez les champs du groupe de contrôles « Inclure / Exclure » pour ajouter des adresses externes et des groupes d'adresses supplémentaires à une liste de contrôle possible et bloquer de force l'indexation de certaines adresses ou groupes d'adresses par l'application.
Étape 2
Réglez les paramètres du programme. Dans la boîte de dialogue "Point de départ de Xenu", cliquez sur le bouton "Plus d'options …". La boîte de dialogue "Options" s'affiche. Basculez vers l'onglet "Basique" de la boîte de dialogue. Définissez le nombre de threads parallèles téléchargeant des données à partir d'Internet en déplaçant le curseur "Parallel Threads". Dans le champ "Profondeur maximale", saisissez une valeur pour la profondeur maximale permettant à l'application d'afficher les liens. Dans le groupe d'éléments "Rapport", activez ou désactivez les options de génération du rapport. Passez à l'onglet "Avancé". Activer ou désactiver des options supplémentaires. Dans la zone Nouvelles tentatives, entrez une valeur pour le nombre maximal de nouvelles tentatives d'URL en cas d'échec. Cliquez sur le bouton "OK".
Étape 3
Obtenez une liste des pages et des liens du site. Dans la boîte de dialogue "Point de départ de Xenu", cliquez sur le bouton "OK". L'application commencera à fonctionner. La barre d'état affichera des informations sur la progression du processus d'acquisition de données. Attendez que le processus se termine. Dans la fenêtre avec une demande de création d'un rapport (fenêtre avec le texte "Lien détective terminé. Voulez-vous un rapport ?") Cliquez sur le bouton "Non".
Étape 4
Extraire tous les liens d'une seule page. Dans la liste des pages que l'application a construites, recherchez la page dont vous souhaitez extraire les liens. Faites un clic droit sur la ligne correspondante. Dans le menu contextuel, sélectionnez l'élément "Propriétés de l'URL". Le champ "… liens sur cette page" de la boîte de dialogue affichée contiendra une liste de tous les liens présents sur la page. Le champ "… faisant un lien vers celui-ci" contiendra les adresses des pages faisant le lien vers celui-ci.
Étape 5
Extraire tous les liens du site. Dans le menu principal, sélectionnez « Fichier » puis « Exporter la carte de page vers un fichier séparé par des tabulations… ». Dans la boîte de dialogue qui s'affiche, spécifiez le nom et le chemin d'enregistrement du fichier. Le fichier résultant contient toutes les adresses des pages de référence et de ciblage dans les champs OriginPage et LinkToPage. Le champ LinkToPageStatus contient les valeurs pour le succès de l'opération de récupération des données depuis le serveur. Importez le fichier dans une base de données (telle que MS Access) pour extraire les liens en fonction de vos critères.