Recherche d’information
Je viens de publier un livre blanc sur les outils de recherche d’informations gratuits et en ligne (télécharger). L’idée sous-jacente à ce travail, et que contrairement à ce que l’on peut penser, la recherche d’information se complexifie avec le développement d’internet. Et que comme pour l’utilisation d’une voiture, d’un traitement de texte, ou de tout autres choses un tant soit peu complexe, cela requière un minimum d’apprentissage.
Le livre blanc mis en ligne présente en 40 pages (avec beaucoup de captures d’écrans) les outils qui me semblent les plus utiles. N’hésitez pas à le télécharger, à le diffuser autour de vous, et à me faire part de vos remarques pour l’améliorer. Christophe Deschamps (outils froids) m’a fait le plaisir d’écrire la préface.
Ambition
Ce guide a pour ambition de vous présenter un certain nombre d’outils qui vous permettrons de mieux rechercher sur internet, c’est-à-dire :
– de trouver plus facilement,
– et de trouver plus vite.
Il se veut pédagogique, et à portée de tous. Ne sont présentés que des outils gratuits et en ligne. C’est-à-dire que vous pourrez les utiliser sans générer de dépenses pour vous ou pour votre organisation, et sans avoir à installer quoi que ce soit sur votre ordinateur. Pour prendre la mesure des différences entre les outils présentés, chacun seront testés avec les mêmes requêtes : soit « intelligence économique », soit « Alain Juillet » pour les moteurs de recherche de personnes.
A quoi et à qui correspondent ces requêtes ? L’intelligence économique est le nom de la discipline qui regroupe les professionnels de la veille, qui ont pour fonction de rechercher des informations, souvent sur internet, de les analyser, et de les transmettre dans leur organisation pour aider à la prise de décision. M. Alain Juillet est haut responsable chargé de l’intelligence économique au secrétariat général de la défense nationale (SGDN). Pourquoi ces choix ? Connaissant bien ces deux sujets, il me sera plus facile de mesure la qualité des
résultats des différents outils testés. L’objectif de ce document est de populariser les outils utiles et efficaces et donc de faire gagner en
productivité les entreprises, sans entrainer de charges. Une second livre blanc présentera d’autres outils gratuits, mais qui nécessitent une installation sur votre poste de travail. Et un troisième traitera des plateformes (payantes) qui offrent des fonctionnalités très performantes.
Que faut-il savoir avant d’en entamer la lecture ?
Les limites de ce travail.
Ce travail, comme tout projet, a ses propres limites. En l’occurrence, je tiens à souligner les points
suivants.
- Cette étude n’est pas exhaustive : Considérez qu’il s’agit ici d’une petite sélection d’outils intéressants (et en aucun cas un panorama complet). En outre, un nombre limité de fonctionnalités est présenté pour chaque outil. N’hésitez pas pour en savoir plus, à consulter les pages « aides » ou FAQ2 de chacun des outils.
- Cette étude n’est pas définitive : Si le classement parait relativement logique, il a néanmoins été difficile à établir car de nombreux outils sont multi-usages, et certaines solutions auraient pu se retrouver dans de nombreuses rubriques.
- Cette étude n’est pas pour les professionnels de la veille : Ce travail s’adresse aux néophytes en recherche de perfectionnement. Les professionnels de la veille, de la documentation, les férus d’informatique se satisferont certainement peu des présentations par trop simplistes, mais (et c’est le but) … abordables par tous.
Pour chaque outil 4 points sont abordés : son adresse, les bénéfices que l’on peut en attendre, une présentation des fonctionnalités, et éventuellement une remarque. L’ensemble est présenté dans un tableau et est accompagné d’une capture d’écran. Enfin, avant d’aborder la présentation des solutions, voici une courte introduction technique. Les moteurs de recherche ont un fonctionnement commun, mais diffèrent par un certain nombre de critères.
Points communs
Pour ce qui est de commun, rappelons simplement qu’ils procèdent tous des même étapes :
- D’abord l’exploration du web, durant laquelle ils vont collecter les informations sur chaque page rencontrée.
- Puis l’indexation, durant laquelle ils vont enregistrer dans une base de données les informations collectées.
- Enfin la recherche, durant laquelle ils vont rechercher les données collectées en fonction des mots clés que vous allez taper dans leur formulaire de requête.
Différences entre outils
Si tous les moteurs passent par ces étapes communes, ils ont tous leurs différences. Voici quelques éléments sur lesquels ils se différencient :
- D’abord la manière d’explorer le web.
- Ensuite, le choix des informations qu’ils vont récupérer des sites visités. Certains moteurs vont conserver le titre de la page, la description qu’en a fait le créateur de la page (metatag), parfois une partie du contenu de la page, …
- La manière de construire l’index, et sa taille. C’est d’ailleurs un des critères de performance le plus souvent mis en avant. En effet, plus un moteur indexe de pages, plus il a de chance de vous fournir un résultat correspondant à votre requête. Google passe pour avoir l’index le plus important. Les chiffres sont néanmoins difficiles à obtenir. En septembre 2005, Google indiquait avoir indexé 24
milliards de pages. Actuellement, si l’on demande à Google de présenter toutes les pages contenant simplement le chiffre 1 (c’est une astuce pour estimer le nombre de pages indexées), il propose 21 milliards de pages. Yahoo! en propose 40 milliards. - La manière de rechercher dans l’index.
- Enfin, la manière de présenter les résultats (on parle alors d’interface). Si Google présente sobrement le titre, un extrait, et quelques autres éléments, d’autres moteurs ont une interface beaucoup plus riche avec présentation d’images, de critères de pertinence, des graphiques, de mots clés, …
Résultats sur différents moteurs de recherche
Tout ceci pour dire que les résultats seront très différents, en quantité, en qualité, et en présentation selon les moteurs. A titre d’illustration, j’ai fait un test sur Google et Yahoo! Le premier test porte sur l’expression « intelligence économique » où l’on voit qu’il n’y a qu’une réponse commune entre les deux moteurs. Le second test porte sur le nom « Alain Juillet », où les correspondances sont plus nombreuses. Ces résultats de recherche sont présentés sous forme de diagrammes, dans lesquels chaque cercle gris représente un résultat, les cercles rouges étant ceux issus de Wikipedia.
Pour comparer les résultats entre moteur, vous pouvez aussi utiliser http://www.graball.com . Supposons que deux personnes fassent une recherche sur ces deux termes, l’un utilisant Google et l’autre utilisant Yahoo ! Supposons qu’ils ne consultent que les 12 premiers liens. Ils ne liront pas une seule page commune !!! Nous pouvons en tirer un premier enseignement. Quelles que soient les qualités de votre moteur de
prédilection, rien ne vaut d’en utiliser plusieurs ! A vos claviers donc pour les tester …
Plan du livre blanc sur les outils de recherche d’informations
1. Outils de recherche d’informations
Rechercher des informations sur des sites
- Google (fonctions avancées)
- Exalead
- iSeek
- MetaCrawler
- Kartoo
- Ixquick
- Lexxe
Rechercher des informations spécifiquement dans les blogs, groupes et forums
- Google (recherche dans les blogs et groupes)
- Technorati
- Blogpulse
- Omgili
Backtype - Rechercher des personnes
- Pilp
- 123 People
Rechercher des informations via les outils sociaux
- BoardReader
- Delver
- How Sociable
Rechercher des informations dans la presse
- Google Actualités
- Yahoo Actualités
- Newsmap
- EUfeeds
- Wikio
Autres outils pratiques
- Delicious ou Diigo, pour gérer ses sources en ligne
- Lexipedia, pour trouver des concepts autour de mots
2. Recevoir automatiquement des informations
Recevoir des alertes
- Google Alert
- Recevoir des flux RSS
- Google Reader
- NetVibes
Autres outils pratiques
- Ponyfish, pour créer un flux RSS
- Feed Rinse, pour filtrer des flux RSS
3. Analyser les informations collectées
Mesurer la notoriété de sites ou de personnes
- Google Trend
- Google Insight
Mesurer le nombre de sites liés à une page
- Google link
- TouchGraph
Vérifier la source
- DomainTools
- Hoaxbuster
- NewsBrief
Autres outils pratiques
- SweSum, pour résumer
- Google traduction ou Reverso, pour traduire
Conclusion : adoptez une stratégie de recherche
Voir nos formations spécialisées sur les outils de recherche d’informations
C1 – Formation Savoir rechercher et veiller sur Internet.
C2- Formation Tout savoir sur la recherche avec (et sans) Google.
A1 – Formation sur les techniques d’analyse
A2 – Formation Benchmarking concurrentiel et de réputation numérique
D1 – Formation optimiser la diffusion de la veille
D2 – Formation Optimiser sa communication digitale
Jérôme Bondu