background preloader

Crawler Robot d'indexation

Crawler Robot d'indexation
Un article de Wikipédia, l'encyclopédie libre. Pour les articles homonymes, voir Spider. Fonctionnant sur le même principe, certains robots malveillants (spambots) sont utilisés pour archiver les ressources ou collecter des adresses électroniques auxquelles envoyer des courriels. En français, depuis 2013, crawler est remplaçable par le mot collecteur[1]. Il existe aussi des collecteurs analysant finement les contenus afin de ne ramener qu'une partie de leur information. Principes d'indexation[modifier | modifier le code] Pour indexer de nouvelles ressources, un robot procède en suivant récursivement les hyperliens trouvés à partir d'une page pivot. Un fichier d'exclusion (robots.txt) placé dans la racine d'un site Web permet de donner aux robots une liste de ressources à ignorer. Deux caractéristiques du Web compliquent le travail du robot d'indexation : le volume de données et la bande passante. Le comportement d'un robot d'indexation résulte de la combinaison des principes suivants : Related:  UE52 Outils de recherche documentaireVeille et études de marchéVeille : outils & techniques

Green open access Libre accès (édition scientifique) Un des logos du libre accès, d'origine de PLoS. Le libre accès (en anglais : open access) est la mise à disposition en ligne de contenus numériques, qui peuvent eux-mêmes être soit libres (Creative commons, etc.), soit sous un des régimes de propriété intellectuelle. L’open access est principalement utilisé pour les articles de revues de recherche universitaires, sélectionnés par des pairs. On devrait, en réalité, distinguer le libre accès (libre open access en anglais) et l'accès ouvert (gratis open access[1]), afin de distinguer plus nettement ce qui est « simplement » en accès gratuit pour l'internaute (accès ouvert) et ce qui est en accès gratuit et libre, parce que soumis à une licence d'utilisation dite libre (Creative commons, par exemple). Il existe deux types[2] de libre accès (à ne pas confondre avec accès libre) avec de nombreuses variations. Le mouvement moderne des archives ouvertes est né avec le potentiel dégagé par l'arrivée d'Internet.

HootSuite Un article de Wikipédia, l'encyclopédie libre. En janvier 2012, HootSuite comptait trois millions d'utilisateurs et sept cents millions de messages envoyés depuis sa plate-forme[2]. HootSuite Media, Inc. est basé à Vancouver au Canada. Histoire[modifier | modifier le code] En 2008, Ryan Holmes est à la recherche d'un outil lui permettant de gérer plusieurs réseaux sociaux pour le compte de son agence de services numériques, Invoke Media. En février 2009, Holmes offre un prix de cinq cents dollars afin de renommer la plate-forme[5]. En décembre 2009, HootSuite quitte Invoke Media. En septembre 2012, HootSuite achète son concurrent Seesmic, un système spécialisé dans la gestion de la relation client. Service[modifier | modifier le code] HootSuite est principalement utilisé par les entreprises pour la gestion en ligne de leurs marques, ainsi que pour envoyer des messages sur le service de microblogging Twitter. Activité commerciale[modifier | modifier le code] Portail d’Internet

Liste de moteurs de recherche Un article de Wikipédia, l'encyclopédie libre. Cet article contient une liste de moteurs de recherche web ou d'entreprise. Moteurs de recherche Web Solidaires et/ou écologiques Ils sont des intermédiaires vers des moteurs de recherche majeurs (ex. : Google, Bing, Yahoo) mais reversent une partie de leurs bénéfices à des œuvres[réf. nécessaire]. Moteurs de recherche d'entreprise Moteurs de recherche libre Classement par spécialisation Moteurs de recherche éducation et recherche Moteurs de recherche pour enfants Principaux : Yahoo! Français : Moteurs de recherche d'images Moteurs de recherche sur les sites de partage FilesTube : le service de moteur de recherche a été interrommpu Moteurs de recherche de recrutement Moteurs de recherche sémantique Moteurs en langage naturel WolframAlpha Moteurs de recherche assurant la confidentialité des recherches Moteurs de recherche d'albums et d'artistes Qwant Music Métamoteurs Liste de métamoteurs de recherche, triés par ordre alphabétique : Annuaire de moteurs

Knowledge Graph Un article de Wikipédia, l'encyclopédie libre. Recherche conversationnelle[modifier | modifier le code] Pendant la conférence annuelle Google I/O de mai 2013, Amit Singhal présente le futur de la recherche selon Google, expliquant les trois fonctions primaires qu'un moteur de recherche devrait remplir : répondre, converser et anticiper. Notes et références[modifier | modifier le code] (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Knowledge Graph » (voir la liste des auteurs).

Brewster Kahle Un article de Wikipédia, l'encyclopédie libre. B. Kahle en nov. 2002 Brewster Kahle (né en 1960) est un informaticien américain, diplômé du Massachusetts Institute of Technology (MIT) en 1982. En 2012, il entre au temple de la renommée d'Internet, dans la catégorie de connecteurs globaux[1]. En 2015, au Chaos Communication Camp, il lance un appel pour « mettre quelque chose par-dessus le web pour le rendre fiable, respectueux de la vie privée, tout en restant drôle. »[1]. Notes et références[modifier | modifier le code] Références ↑ a, b et c Jérôme Hourdeaux, « Brewster Kahle veut numériser le « meilleur de l'humanité » » [archive], sur Médiapart,‎ Liens externes[modifier | modifier le code]

25 astuces pour la recherche sur Google Google est le moteur de recherche le plus utilisé dans le monde. Et de loin ! Selon StatCounter, il représenterait pas moins de 90% de l’ensemble des requêtes, devant Bing et Yahoo. Si le moteur se suffit à lui-même pour la plupart des cas, de nombreuses options sont disponibles pour affiner les recherches. Affiner la recherche Google De nombreuses astuces permettent d’optimiser la recherche sur Google. Les symboles pris en compte par Google Le moteur de recherche permet d’utiliser de nombreux opérateurs pour affiner une recherche. Les guillemets permettent de rechercher l’ensemble d’une expression.Ajouter une tiret devant un mot permet de l’exclure de la recherche.Ajouter un tilde (~) devant un mot permet d’inclure les synonymes de celui-ci.Utiliser une étoile (*) à la place des mots inconnus permet de les trouver : très utile lorsqu’on est à la recherche d’une expression oubliée. Ce que Google ne prend pas en compte Rechercher sur un seul site

Comment automatiser le web (robot, crawler, scraper) ? Vous connaissez les macros sur Excel qui vous permettent d’abattre des tâches répétitives et de vous faire gagner un temps considérable ? Sur le web, il existe des technologies du même acabit grâces auxquelles vous n’effectuerez plus aucune tâche répétitive. On parle alors de robots, de crawling, de scraping, de data-mining… Pourquoi est-il utile d’automatiser votre navigation sur le Web ? Pour impressionner vos collègues et votre chefPour gagner en productivité (dès qu’une tâche est répétitive, vous l’automatisez ) et économiser votre temps.Pour faire de la recherche fondamentale (par exemple analyser des champs lexicaux dans des blogs)Pour surveiller les faits et gestes de vos concurrents (prix de leurs produits, nouveautés, etc.).Pour faire une étude de marché complète et actualisée (par exemple en suivant les annonces de tel produit sur Leboncoin).Pour tester automatiquement votre site Internet sur différents navigateurs.Pour créer de nouveaux services sur Internet. I. a) IFTTT II.

Optimisation pour les moteurs de recherche Un article de Wikipédia, l'encyclopédie libre. L’optimisation pour les moteurs de recherche (en anglais : Search engine optimization, SEO) est un ensemble de techniques visant à favoriser la compréhension de la thématique et du contenu d'une ou de l'ensemble des pages d'un site Web par les moteurs de recherche. Ces techniques visent donc à apporter un maximum d'informations concernant le contenu d'une page web aux robots d'indexation des moteurs de recherche. Le pluriel de l'acronyme SEO peut se référer aux « search engine optimizers » qui fournissent des services SEO. Historique[modifier | modifier le code] L'optimisation pour les moteurs de recherche a commencé avec l'apparition des premiers annuaires et moteurs de recherche dès 1994. Enjeux du SEO[modifier | modifier le code] L'optimisation pour les moteurs de recherche ou search engine optimization représente un véritable enjeu à plusieurs niveaux : Techniques du SEO[modifier | modifier le code] [modifier | modifier le code]

Lesannuaires : Annuaire web thématique 52 outils de recherche sur Internet et Méthodologie de veille informationnelle sur le Web Le site collaboratif des professeurs documentalistes de l’Académie de Besançon propose 2 articles récents et intéressants pour les internautes, ainsi que pour les acteurs de terrain et usagers des EPN. Il s’agit de ressources pour trouver et organiser de l’information sur le Web, trier les contenus recueillis voire les rediffuser. 52 outils de recherche sur Internet L’article Outils de recherche sur le Web pointe directement vers 52 outils de recherche en ligne classés en 9 catégories : pages Web, actualités, images, divers, blogs, cartes, vidéos, plateformes collaboratives, les projets de la Wikimedia Foundation. De quoi satisfaire sa curiosité d’esprit et les centres d’intérêt des internautes ; le tout présenté sous la forme d’un article via des entrées outil par outil avec liens directs facilitant l’accès vers les moteurs de recherche et autres plateformes qui permettent de rechercher de l’information sur Internet. Méthodologie de veille informationnelle sur Internet 1.

Les agents intelligents Un agent intelligent est un logiciel mis au point pour remplir et automatiser une tâche sur un réseau pour le compte de son utilisateur. C'est un outil synonyme de gain de temps dans la surveillance et la collecte des informations recherchées par l'entreprise. L'utilisateur définit les paramètres de la mission que l'agent va remplir de façon autonome en rendant compte de ses résultats. Toutes les sources d'informations accessibles sur un réseau (Internet le plus souvent) peuvent être surveillées par un agent intelligent : fichiers particuliers, pages web, bases de données, forums de discussions, newsletters, etc. Fonctionnement de l'agent intelligent Un agent intelligent est plus qu'un simple système de recherche d'informations. 3 caractéristiques fondamentales de l'agent intelligent : 1. A savoir: A consulter: Cybion leader français des agents intelligents Les applications des agents intelligents Le paramétrage de l'agent exige de bonnes connaissances informatiques. Les agents de veille

[Guide] Google : conseils, utilisation, astuces... : Tutoriels et tests Bonjour à tou(te)s, voici un guide, que j'avais envie d'écrire depuis un bon moment. Ceci est la première version ; comme les autres guides du site, je fais des mises à jour, corrections et améliorations au fil de vos remarques et questions, dans ce sujet ou par MP. Pour des questions de lisibilité j'indique en italique les séquences de mots clefs à taper, plutôt que d'ajouter des guillemets, car cela pourrait prêter à confusion. Introduction Nous sommes parfois confrontés à ce problème un jour ou l'autre, sur un forum, on nous dit "google est ton ami", de chercher d'abord sur google une réponse, etc etc, les images humoristiques fleurissent à ce sujet... en voici quelques unes... En dehors des forums aussi, parfois on cherche, mais on ne trouve pas, ou pas exactement, parfois faute d'exploiter correctement les possibilités des moteurs de recherches... La principale difficulté est de donner des conseils qui soient valables pour tous, car la quantité de recherches possibles est infinie.

Sites sur le droit - Sénat Allez au contenu, Allez à la navigation Le sommaire ci-dessous vous permet d'accéder directement à chacune des sous rubriques. Les sites payants ne sont mentionnés que lorsque les documents ne sont pas disponibles en libre accès sur Internet. Actualité juridique France Europe L'Union européenne : consulter à partir de la page d'accueil l'actualité de l'UE par thème Europa : la salle de presse de l'Union européenne Portails du droit Légifrance (site officiel) Droit.org (portail de droit français) Service public (le portail de l'administration) Droit en ligne (portail de l'association "droit en ligne") (annuaire juridique francophone) Légicité (moteur de recherche sur des sites juridiques) Le village justice (site de juristes praticiens) Juriguide (annuaire de sites juridiques) Globalex (en anglais, recherche en droit étranger, droit comparé et droit international) Rapports les plus consultés

Related: